Ho un modello di tipo Alfresco con una proprietà aggiuntiva di tipo d:content
. Questa proprietà causa eccezioni Solr quando provo a memorizzare contenuti di dimensioni superiori a 32 KB. L'attuale definizione di questa proprietà èIndicizzazione d: proprietà del contenuto con contenuto> 32 KB
<property name="acme:secondContent">
<type>d:content</type>
<mandatory>false</mandatory>
<index enabled="true">
<atomic>true</atomic>
<stored>true</stored>
<tokenised>both</tokenised>
</index>
</property>
Se metto contenuti più grande che 32 KB in questa proprietà, Solr genera questa eccezione quando cerca di indicizzarlo:
java.lang.IllegalArgumentException: Document contains at least one immense term in field="[email protected][email protected]{http://acme.com/model/custom/1.0}secondContent" (whose UTF8 encoding is longer than the max length 32766), all of which were skipped. Please correct the analyzer to not produce such terms.
Modifica della configurazione index
non aiuto, l'errore viene generato con tutte le varianti di index
e gli elementi secondari che ho provato.
In another question si risponde:
La dimensione massima per il singolo un termine nell'indice Lucene sottostante è 32776 byte, che è credo disco codificato.
Come si configura il index
di una proprietà d:content
modo che io possa salvare e indicizzare i contenuti superiori a 32 KB?
Edit:
In contentModel.xml
, cm:content
è configurato in questo modo:
<index enabled="true">
<atomic>true</atomic>
<stored>false</stored>
<tokenised>true</tokenised>
</index>
L'aggiunta di un semplice file text/plain
con un contenuto maggiore di 32 KB funziona senza problemi.
La stessa configurazione index
per la mia proprietà personalizzata non riesce ancora.
Aggiornamento:
Sotto Alfresco 4.2fCE, il problema non non si verificano. Quindi questo è un bug in Alfresco 5.0c insieme a Solr 4.1.9.
Aggiornamento 2:
ho filed a bug in the Alfresco JIRA.
L'impostazione '' true dovrebbe essere d'aiuto. Qual è il contenuto di quel campo? Perderai qualcosa se lo hai solo in forma tokenizzata? Avendolo in forma di corda consentirebbe l'ordinamento e la sfaccettatura. È richiesto per quel campo? –
cheffe
No, l'ordinamento e la sfaccettatura non sono richiesti. Proverò qualche altra combinazione –
C'è qualche ragione per cui non è possibile estendere cm: il contenuto che include una proprietà d: content? – crownjewel82