Recoll-Lens o como realizar búsquedas de texto en Ubuntu

Introducción

Recoll es una herramienta de búsqueda de archivos basada en texto, es decir, busca los archivos por el contenido de los mismos, indexando gran cantidad de tipos de archivos incluyendo LibreOffice/OpenOffice, MS Office, PostScript, archivos de audio, en función de sus etiquetas, así como imágenes, también basándose en sus etiquetas. Además, Recoll, permite realizar búsquedas avanzadas, ya sea por el autor, por el tamaño del archivo, por el formato del mismo, por su ubicación, así como realizar consultas utilizando operadores booleanos.

Creo que esto ya lo he dicho en alguna que otra ocasión, y es que dado lo caótico del orden de mis directorios y archivos, localizar un documento, siempre se termina convirtiendo en una búsqueda, que de normal viene determinado por el título del documento, que a veces, y solo a veces puede facilitar la extensión del archivo en cuestión, pero no siempre.

No conocía en absoluto el proyecto Recoll, pero gracias a WebUpd8, se me ha abierto un nuevo campo de posibilidades en la inmersión en mi caótico orden de directorios, archivos y documentos.

recoll

Recoll

Cuando instalas Recoll, realiza una indexación de todos tus archivos, para posteriormente realizar búsquedas en los mismos. Se trata de una herramienta de fácil instalación (lo puedes hacer vía PPA), con pocas dependencias, sin demonios, ni servidores web, ni nada por el estilo. Tiene una interfaz implementada en Qt, además de su propio comando para utilizar con el terminal. Es capaz de buscar en una gran variedad de tipos de documentos, correos electrónicos, y en los adjuntos a los correos electrónicos, además de manejar archivos comprimidos (gzip y bzip2). Dispone de un potente sistema de consulta, con la posibilidad de utilizar comodines, búsquedas booleanas «and»,»or»,.., por extensión o tipo de archivo, por directorio, etc. Además, se trata de una aplicación multilenguaje y trabaja con caracteres Unicode, lo cual es un gran alivio, porque por lo menos a mi esto siempre me trae de cabeza. Además de todo esto, Recoll, tiene una amplia documentación, con un completo manual de usuario y las páginas de ayuda correspondientes para cada comando.

recoll

Algunos de los tipos soportados por Recoll son los siguientes, aunque puedes consultar la lista completa en Recoll:

  • archivos de texto
  • archivos HTML
  • maildir y mailbox (Mozilla, Thunderbird y Evolution)
  • Scribus
  • las páginas Man (necesitará groff)
  • Abiword
  • Microsoft Office Open XML
  • OpenOffice
  • SVG
  • Gnumeric
  • pdf (utilizando el comando pdftotext)
  • msword (utilizando antiword)
  • Powerpoint y Excel (utilizando las utilidades catdoc)
  • CHM (la ayuda de Microsoft) con Python, pychm y chmlib.
  • Archivos Zip
  • Archivos Rar (para esto necesitará el modulo de Python rarfile y la utilidad unrar)
  • iCalendar(.ics)
  • RTF
  • TeX
  • dvi
  • djvu
  • las etiquetas de archvo de audio
  • las etiquetas de imágenes (exif)

Recoll-Lens

Pero además de las posibilidades que aporta Recoll, si utilizamos Ubuntu con Unity, podemos instalar Recoll-Lens, que es la Lente que nos permitirá realizar las búsquedas directamente desde el Dash o tablero, con la simplicidad y funcionalidad que esto nos aporta.

recoll

Instalación

Para instalar Recoll y Recoll Lens, tienes que añadir el siguiente repositorio y actualizar:


sudo add-apt-repository ppa:recoll-backports/recoll-1.15-on && sudo apt-get update

Una vez añadido el repositorio puedes instalar tanto Recoll como Recoll-Lens, desde la línea de comandos:


sudo apt-get install recoll recoll-lens

Conclusión

Se trata de una herramienta muy potente para la búsqueda de documentos en función de su contenido, lo que ayuda considerablemente, sobre todo si no tienes un orden en los documentos guardados, dado que una búsqueda se puede convertir en toda una odisea.
Más información | Recoll
Vía | WebUpd8

2 comentarios en “Recoll-Lens o como realizar búsquedas de texto en Ubuntu

  1. Cex hace 10 años

     Hay dos cosas bastante productivas que echaba de menos en Unity:

    – Una era precisamente una lupa para buscar en el contenido de los archivos. Yo sugería usar Tracker, pero parece que Recoll es muy parecido.

    – La otra es la posibilidad de tener entradas en las listillas de los lanzadores  para abrir directamente el tablero con los últimos archivos con los que ha trabajado dicho programa. Por ejemplo, que en la listilla de Writer aparezca «Documentos recientes» para abrir el tablero con los últimos archivos con los que ha trabajado Writer.

    Hay una tercera cosa que no tengo clara su ventaja. Consiste en una lupa que permita buscar directamente en el tablero con los motores de búsqueda del perfil de Firefox, como hace Synapse. Se elegiría el motor de búsqueda en los filtros de la lupa.

  2. Cex hace 10 años

    «Dado lo caótico del orden de mis directorios y archivos, localizar un documento, siempre se termina convirtiendo en una búsqueda»

    Al igual que para buscar aplicaciones, los términos de búsqueda también se pueden aplicar para buscar archivos y carpetas en el tablero. Si se escribe «navegador» nos mostrará los archivos html que hayamos abierto recientemete, con «gimp» obtendremos los xcf, con «image» los png, jpg, gif…

    Supongo que los términos de búsqueda se basa en la información de los campos GenericName y MimeType de los .desktop de /usr/share/applications. Aunque hay casos que no me cuadran como «libre», «program»…

    Además, en el próximo Ubuntu 12.04 escribiendo el nombre de una carpeta aparecen también los archivos que contiene. De esta manera se pueden usar varios criterios de búsqueda. Por ejemplo escribiendo: urgente (el nombre de una carpeta) texto (de procesador de textos) a (para los archivos que tengan una palabra o extensión que comience por a). En el tablero aparecerán ordenados por usados más recientemente los archivos abiertos por Writer de la carpeta «urgente» que en el nombre haya una palabra que comience por «a».

    Si se desea usar varios criterios de búsqueda hay que escribir los términos completos, sino vale con comenzarlos.

    Esto es algo poco documentado o por lo menos yo no he encontrado información al respecto. Copio algunos términos de búsqueda y los tipos de archivos que muestran:

    editor: txt, sh, odf, xfc
    viewer: pdf, otf, ttf, jpg, png, gif
    text: txt, sh
    image: png, jpg, gif
    rhythmbox music player: ogg, mp3
    firefox, navegador web: html
    archive manager: 7z, tar.gz, tar.bz2, zip, rar, xpi
    ubuntu software center: deb
    gimp: xcf
    font: ttf, otf
    libre office: odt, doc, ods, xls, odp, pps, odg, odb
    writer, procesador de texto: odt, doc
    calc, hoja de cálculo/calculo: ods, xls
    impress, presentación: odp, pps
    draw, dibujo: odg
    base de datos: odb
    math, fórmulas: odf

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *