« Juliaやってみよう。五日目。Pythonと速度比較。 | トップページ | シネッセンス細胞がアツい。不老不死とハゲの治療が同時に可能か? »

2017年9月 8日 (金)

古めの論文でテキスト選択がおかしい時の対処法

Multicolumn

例えば、Acrobatを使っているときに、テキスト選択ツールで、左のカラムを文章をコピーしたい。一行しか選択しないのなら問題はないが、複数のラインになるとまれに、右のカラムにまで選択範囲が行ってしまって、そっちじゃねーよとなる。

古めの論文にありがちですね。上のイメージは2005年のNeuron。

これは、古めの論文だとPDFに文章の構造を指定するタグをちゃんと埋め込んでいないため、PDFリーダーが賢くないとカラムの構造の類推に失敗することから起こる問題のようです。というかAcrobatでもダメなのでタグが無いようなPDFは出版社が悪いと思う。

ウィンドウズの場合は、PDF-XChange Editorだったら下の様に簡単にボックス選択できるのでなんとかなる。PDF-XChange Editorはフリーで、互換性まったく問題なし、本家Acrobatより速いのでおすすめです。

Pdf_xchange

Macな方の場合、PDF-XChangeがないのでAcrobatを使うしかないのが問題でしたが、最近Acrobat Proならばタグを自動で埋め込むことで大部分解決することを発見。たまにPDFからテキストをコピペするとスペースが抜けている場合がありますが、これもタグを削除して、自動生成し直すと治る。

やり方は「既存の PDF へのタグの追加」を参考に、ツールからアクセシビリティを選んで、文書にタグを追加を選択する。そうすると文章の構造を適当に認識してタグを追加してくれる。これで、大抵は治る。Acrobat Proじゃないといけないのが残念。

タグを直したほうが、ボックス選択よりも文章の選択が細かにできるので、Proのライセンスあるのならタグを追加するのが一番よい。PDF-XChange Editorでタグの編集とか追加はちょっと試したが、できなそうかな。。

なぜアクセシビリティにそんな機能があるのかというと、文章の読み上げ機能にカラムの構造の正しい認識が必要なため。

« Juliaやってみよう。五日目。Pythonと速度比較。 | トップページ | シネッセンス細胞がアツい。不老不死とハゲの治療が同時に可能か? »

パソコン・インターネット」カテゴリの記事

学問・資格」カテゴリの記事

コメント

コメントを書く

コメントは記事投稿者が公開するまで表示されません。

(ウェブ上には掲載しません)

トラックバック

この記事のトラックバックURL:
http://app.f.cocolog-nifty.com/t/trackback/1169291/71646674

この記事へのトラックバック一覧です: 古めの論文でテキスト選択がおかしい時の対処法:

« Juliaやってみよう。五日目。Pythonと速度比較。 | トップページ | シネッセンス細胞がアツい。不老不死とハゲの治療が同時に可能か? »

広告欄


やっつけタイムライン

広告欄

はてブ

人目の訪問です。

  • follow us in feedly

    かなり更新が不定期なため、RSSリーダーをオススメします。現在Feedlyに122人登録頂いています。多謝!RSSを表示

    ブログランキング用 にほんブログ村 IT技術ブログ Pythonへ ブログランキングならblogram






    Jenny Mayhem
2017年12月
          1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30
31            

IT技術注目記事

無料ブログはココログ