« Juliaやってみよう。五日目。Pythonと速度比較。 | トップページ | シネッセンス細胞がアツい。不老不死とハゲの治療が同時に可能か? »

2017年9月 8日 (金)

古めの論文でテキスト選択がおかしい時の対処法

Multicolumn

例えば、Acrobatを使っているときに、テキスト選択ツールで、左のカラムを文章をコピーしたい。一行しか選択しないのなら問題はないが、複数のラインになるとまれに、右のカラムにまで選択範囲が行ってしまって、そっちじゃねーよとなる。

古めの論文にありがちですね。上のイメージは2005年のNeuron。

これは、古めの論文だとPDFに文章の構造を指定するタグをちゃんと埋め込んでいないため、PDFリーダーが賢くないとカラムの構造の類推に失敗することから起こる問題のようです。というかAcrobatでもダメなのでタグが無いようなPDFは出版社が悪いと思う。

ウィンドウズの場合は、PDF-XChange Editorだったら下の様に簡単にボックス選択できるのでなんとかなる。PDF-XChange Editorはフリーで、互換性まったく問題なし、本家Acrobatより速いのでおすすめです。

Pdf_xchange

Macな方の場合、PDF-XChangeがないのでAcrobatを使うしかないのが問題でしたが、最近Acrobat Proならばタグを自動で埋め込むことで大部分解決することを発見。たまにPDFからテキストをコピペするとスペースが抜けている場合がありますが、これもタグを削除して、自動生成し直すと治る。

やり方は「既存の PDF へのタグの追加」を参考に、ツールからアクセシビリティを選んで、文書にタグを追加を選択する。そうすると文章の構造を適当に認識してタグを追加してくれる。これで、大抵は治る。Acrobat Proじゃないといけないのが残念。

タグを直したほうが、ボックス選択よりも文章の選択が細かにできるので、Proのライセンスあるのならタグを追加するのが一番よい。PDF-XChange Editorでタグの編集とか追加はちょっと試したが、できなそうかな。。

なぜアクセシビリティにそんな機能があるのかというと、文章の読み上げ機能にカラムの構造の正しい認識が必要なため。

« Juliaやってみよう。五日目。Pythonと速度比較。 | トップページ | シネッセンス細胞がアツい。不老不死とハゲの治療が同時に可能か? »

パソコン・インターネット」カテゴリの記事

学問・資格」カテゴリの記事

コメント

コメントを書く

(ウェブ上には掲載しません)

トラックバック


この記事へのトラックバック一覧です: 古めの論文でテキスト選択がおかしい時の対処法:

« Juliaやってみよう。五日目。Pythonと速度比較。 | トップページ | シネッセンス細胞がアツい。不老不死とハゲの治療が同時に可能か? »

しろののツイッタータイムライン

  • ツイッターは5つ目も凍結されました。6つ目での復活も不可能。なのでnoteに注力しています。

    と思ったら、イーロン・マスクの買収が公になってアカウントが復活できました。ありがとうマスク。

    トランプ関連記事の一覧リスト

オススメたち

2024年12月
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30 31        

はてブ

無料ブログはココログ