Wednesday 24 March 2010

Jemnější konfigurace pro formátové konverze a fulltextové indexování v UCM

UCM umožňuje provádět po vložení nového dokumentu automaticky některé operace. Mezi ty "dražší" (pokud jde o zatížení procesoru) jsou formátové konverze a indexování souboru pro fulltextové vyhledávání.

Obě operace je možné konfigurovat už ve standardní instalaci Content Serveru:
  • konverze se konfigurují v Configuration Manageru a základním dělícím kritériem je zde MIME type (resp. přesněji řečeno, jak nás upozornil jeden partner, přípona souboru)
  • indexování se konfiguruje přímo v základním konfiguračním souboru config.cfg
Toto nastavení je v některých případech bohužel příliš hrubé - např. neumožňuje definovat pro různé soubory MS Word užití různých konverzí. Ještě markantnější je to u fulltextového indexování - jsou indexovány všechny nebo žádné soubory (resp. v druhém případě se volba jmenuje metadata_only, tj. jsou indexována metadata). Toto může představovat určitý problém např. tehdy, je-li UCM využíváno jako úložiště nejrůznějších typů obsahu, tj. zejména těch, které je indexovat žádoucí a naopak těch, u kterých to nedává smysl, jako jsou naskenované image či multimediální obsah (zvukové záznamy, obrázky, videa).

Pro tyto účely vznikla standardní komponenta SelectivelyRefineAndIndex. Komponenta umožňuje dále zjemnit kritéria, přičemž na doplnění kritérií je možné využít jakoukoliv hodnotu v metadatech položky - viz příklad:

<@dynamichtml pre_search_index_file@>
<$if strEquals(dDocType, "ACCOUNTING") and strEquals(dFormat, "application/vnd.ms-excel")$>
<$doIndex=0$>
<$endif$>
<@end@>


Pro indexování je nastavitelný vlastně jen jediný parametr, doIndex, který má hodnotu 0, pokud se položka fulltextově indexovat nemá a pokud ano, má hodnotu 1. Dále se pak využívá ta metoda fulltextového indexování, která je nastavena globálně.

Pro konverze je pak možné upřesnit, jaká konverze se má přesně provést:
<@dynamichtml pre_submit_to_conversion@>
<$if strEquals(dDocType, "MARKETING")$>
<$dConversion="PASSTHRU"$>
<$elseif strEquals(dDocTitle, "Image")$>
<$dConversion="MultipageTiff"$>
<$endif$>
<@end@>

No comments:

Post a Comment