2013-08-01 20 views
5

cerco di indicizzare i file PDF con Sitecore 7. ho installato IFilter, ma ho ricevuto cingolati login successivo errore:Sitecore 7 pdf indicizzazione

ManagedPoolThread #17 09:24:20 WARN LuceneIndexOperations : Update : Could not build document data 4433434-3443-3223-91c4-233232. Skipping. 
Exception: System.Runtime.InteropServices.COMException 
Message: Error HRESULT E_FAIL has been returned from a call to a COM component. 
Source: mscorlib 
    at System.Runtime.InteropServices.ComTypes.IPersistFile.Load(String pszFileName, Int32 dwMode) 
    at Sitecore.ContentSearch.Extracters.IFilterTextExtraction.FilterLoader.LoadAndInitIFilter(String fileName, String extension) 
    at Sitecore.ContentSearch.Extracters.IFilterTextExtraction.FilterReader..ctor(String fileName) 
    at Sitecore.ContentSearch.ComputedFields.MediaItemIFilterTextExtractor.ComputeFieldValue(IIndexable indexable) 
    at Sitecore.ContentSearch.ComputedFields.MediaItemContentExtractor.ComputeFieldValue(IIndexable indexable) 
    at Sitecore.ContentSearch.LuceneProvider.LuceneDocumentBuilder.AddComputedIndexFields() 
    at Sitecore.ContentSearch.LuceneProvider.LuceneIndexOperations.GetIndexData(IIndexable indexable, IIndexable latestVersion, IProviderUpdateContext context) 
    at Sitecore.ContentSearch.LuceneProvider.LuceneIndexOperations.BuildDataToIndex(IProviderUpdateContext context, IIndexable version, IIndexable latestVersion) 
    at Sitecore.ContentSearch.LuceneProvider.LuceneIndexOperations.<>c__DisplayClass7.<Update>b__0(Item version) 

Cosa devo fare il lavoro a causa della documentazione Sitecore hanno detto deve funzionare fuori dagli schemi.

risposta

4

Ho avuto lo stesso problema e ho ricevuto da Sitecore supporto successivo risposta (funziona dopo benissimo):

1) copiare tutti i file dll Adobe IFilter nella cartella "\ System32 \ Inetsrv". Questa è la directory di lavoro per IIS su Windows Server. I file Adobe iFilter .dll sono memorizzati nella cartella "C: \ Programmi \ Adobe \ Adobe PDF iFilter 9 per cartelle a 64 bit \ bin" per impostazione predefinita. Inoltre è possibile utilizzare la funzione "IFilter Explorer" per rilevare la cartella in cui sono memorizzati i file dll: http://www.citeknet.com/Products/IFilters/IFilterExplorer/tabid/62/Default.aspx Per maggiori dettagli si veda lo screenshot: http://screencast.com/t/xmWukanM+

2) Eliminare tutti i file sotto il "Sito web/App_Data/MediaCache "cartella;

3) Ricreare gli indici di ricerca Sitecore (Sitecore -> Pannello di controllo -> Indicizzazione -> Gestore indicizzazione);

4) Cancella la cache del Sitecore (lo http: // {hostname} /sitecore/admin/cache.aspx tool); 5) Riavvia IIS;

+0

Grazie, sta funzionando –

1

Ecco la soluzione che ho preso poiché non mi piaceva l'idea di copiare DLL relative a iFilter nel percorso di sistema.

  • installare Adobe IFilter 9 (I used this link). Nota versione 9 è essenziale poiché a partire dalla versione X l'interfaccia abandoned file based.
  • aggiungere la posizione del filtro alla variabile di ambiente PATH. Nel mio caso era %ProgramFiles%\Adobe\Adobe PDF iFilter 9 for 64-bit platforms\bin\.
  • run iisreset
  • tornare all'app Sitecore ed eseguire la ricostruzione dell'indice per gli indici necessari.

Per la vostra considerazione:

  • durante il tentativo di risolvere il problema ho concesso pieno accesso a cartelle IFilter per conto pool di app. Non penso sia necessario perché l'ho rimosso alla fine e tutto funzionava ancora bene.

Dopo questi passaggi l'indicizzazione in formato PDF ha iniziato a funzionare correttamente sulla mia istanza di Sitecore 7 in esecuzione su Windows 8.1.

+0

URL aggiornato per chi cerca da quando il link qui sopra non funziona: http://download.adobe.com/pub/adobe/acrobat/win/9.x/PDFiFilter64installer.zip – Daved