ScanSnapでOCRかけたPDFからテキストを抽出する

Ubuntu Linux 10.10

$ sudo apt-get install poppler-utils
$ pdftotext in.pdf out.txt

日本語入ってても大丈夫。