Há possibilidade de usar o TAINACAN para indexar PDFs pesquisáveis sem a necessidade de um programador?

Há possibilidade de usar o Tainacam para indexar arquivos PDF pesquisáveis (com conteúdo pesquisável) e depois buscá-los? Vi material no Wiki do Tainacan a respeito mas ele precisa a introdução de linhas de comando o que, no meu entender, exige a presença de um programador. Não é o meu caso. Não dispomos de programador e nem podemos pagar um. Há como instalar ou reinstalar o Tainacan já com buscas em PDF funcionando???

1 curtida

Bom dia @Jbaguiar
hoje esse recurso é experimental, por isso por padrão ele está desativado, a configuração que deve ser feita na instalação é relativamente simples para ativar o recurso, não precisa ser feita necessariamente por um dev.

Caso se sinta desconfortável em fazer isso, podemos ajudar acompanhando um passo a passo com você por aqui.

Abraços

1 curtida

Agradeço a ajuda! Pode ser as 11h de hoje? Como nos conectamos?

Ou quando puderes.

Algo para se pensar nesta caso, é a quantidade de pdf e o tamanho deles x configuração do servidor que você pretende utilizar. Esta função pede bastante recursos do servidor, e se for um compartilhado e com muitos pdf, tente a não dar conta.

opa… desculpe só vi agora, acho que podemos começar com você falando como a sua instalação foi montada? é um serviço compartilhado? (localweb, hostgator, etc…) é uma cloud (amazom, digitalocean) ou é um servidor próprio?

realmente isso é uma questão a ser levantada, a quantidade de informações que o recurso vai gerar dentro da sua instalação pode deixar a instalação pesada.

att!

1 curtida

Oi! É na Hostgator.
Trata-se de coleção de recorte de jornais (uma página por arquivo) digitalizado em jpg e transformados em PDF pesquisável pelo Adobe Acrobat. Serão cerca de 5 mil arquivos, p menos.
Meu Whats é 5198XXXXXXX.

JB

Boa tarde, vamos tentar ajudar por aqui,
como descrito em Tainacan Wiki

Para ativar a indexação de PDF é preciso alterar o arquivo wp-config.php

1. Logue em seu cPanel, vá em Arquivos > Gerenciador de arquivos

2. Procure pela pasta que fez a instalação de seu WordPress (caso tenha instalado no domínio principal a pasta será a public_html ), encontre o arquivo wp-config.php e clique com o botão direito do mouse sobre ele, e então clique em Edit .

3. Dentro do arquivo wp-config.php insira a linha

/* Indexar conteúdos de PDFs */ 
define('TAINACAN_INDEX_PDF_CONTENT', true);

antes da linha:

/* That's all, stop editing! Happy publishing. */

Salve a alteração feita no arquivo.

Após fazer isso os novos PDF utilizados como documento principal de um item serão indexados, e o conteúdo deles utilizados para realizar buscas por itens.

Att!

referencia:

2 curtidas

Se for um servidor compartilhado da hostgator, acredito que não vai dar conta da necessidade (5 mil arquivos em pdf). Ainda mais que cada arquivo em pdf pode ter várias páginas. Sugiro realizar alguns testes antes.

1 curtida

Oi ! Desculpa a demora: 1) o que queres dizer com “os novos PDF utilizados como documento principal de um item serão indexados”??
— 2) os PDFs buscáveis colocados em coleções serão indexados? 3) Apenas os PDFs adicionados depois da modificação indicadoa no arquivo PHP serão indexados? 4) Os PDFs tem que ser produzidos em algum formato em especial ? 5) Há um comando para indexar e reindexar manualmente os arquivos PDFs já incluídos em ColeçÕes no Tainacan?

Caro VNMedeiros! Agradeço retorno!

Sds. João Batista

1 curtida