Wordから画像を一気に取出す方法 -追伸-

シンです。
気がつけばもう今年も1月あまり、本当に一年が経つのは早いものです。
今回のブログですが、gula君の最近のブログに付けたしで書かせてもらうことにしました。
このブログによると、WORDの文書の拡張子を「ZIP」に変えてやるだけで、WORDに貼ってある画像を取り出すことができるということでした。私も興味があったので、早速試してみたのですが、残念ながらうまく行きませんでした。そこで、色々調べてみたところ、この方法はWORD2007以降(WORD2007もしくは2010)でないと使えないことがわかりました。ではそれ以前のバージョンのWORD(WORD97、WORD2000、WORD XP、WORD2003など)で作成した文書から画像を取り出すにはどうすればいいのかというのが今回のブログの主題です。

まずは事前の準備-拡張子を表示する

gula君の紹介してくれた方法は、確かにやり方は簡単なのですが、一つ大きな問題があります。それは、「拡張子」を手動で変えなければいけないということです。拡張子とは、ファイル名の末尾につけられたファイルの種類を識別するための文字列で、通常ファイル名の本体と拡張子は “.”(ピリオド、ドット)で区切られています。拡張子はアルファベットと数字の組み合わせで、歴史的には3文字以内が好まれてきましたが、それ以上の文字数の場合もあります。WORDの場合は2003以前が「*.doc」、2007-2010が「*.docx」(*は任意のファイル名。以降同じ意味。)となります。

WINDOWSでは初期設定では拡張子を表示する設定にはなっていません。これはWINDOWSが拡張子によってファイルの種類を判別しており、ユーザーが不用意にこれを書き換えてファイルが開けなくなってしまうなどの危険を防ぐためにそういう設定になっていると思われます。そこで、拡張子を手動で変えるためには、まず拡張子を表示するようにWINDOWSの設定を変えてやる必要があります。

WINDOWS XPでは、「マイコンピュータ」→「ツール」→「フォルダオプション」→「表示」タブの項目で「登録されている拡張子は表示しない」の前についているチェックを外せばOKです。しかし、WINDOWS VISTAやWINDOWS 7といった最近のOSではマイコンピュータがなくなってしまったため、どこで設定を変えればよいのかわかりにくくなっているようです。これらのOSでは「スタートメニュー」→「コントロールパネル」→「デスクトップのカスタマイズ」→「フォルダオプション」の「表示」のタブに同じ項目があるので、ここで設定すればOKです。(ちなみに、WINDOWS XPの「コントロールパネル」にも「フォルダオプション」があります。)

拡張子を表示するということは、先に述べたようなリスクが伴いますので、必要なときだけ設定を変えて拡張子を表示するようにする方がよいのかも知れません。実際、ネットでWORDから画像を取り出す方法を色々調べていると、拡張子を表示するように設定したら、作業後にはまた拡張子を表示しないように再び設定しなおすように指示しているものも見受けられます。

しかし、一部のWindowsではUnicodeの制御文字の一つであるU+202E(RIGHT-TO-LEFT OVERRIDE)をファイル名に使用することで、拡張子を末尾以外の場所に表示させることが可能なため、例えばSAMPLE-(U+202E)TXT.EXEというファイル名はSAMPLE-EXE.TXTと表示され、拡張子を表示しない設定にしていると、一見テキストファイルに見えます。この仕組みを悪用して、メールにこのようなファイルを添付し、誤って開くとウイルスやマルウェアなどの悪意のあるプログラムが実行されるようにするという事例もあり、これを回避するには、逆に拡張子を表示する設定にしておいた方がよいことになります。

このようにどちらのリスクを重視するかによって、拡張子を表示する、しないはそれぞれのユーザーが決める必要があります。

2003以前のWORDで画像をまとめて取り出す方法

ではいよいよ、2003以前のバージョンのWORDで画像を取り出す方法についてご紹介しましょう。こう書くと、何かとても大変なことのように思われるかもしれませんが、実はとても簡単なことです。それは、WORD文書を「Webページ(*.htm)で保存」すればよいのです。
保存する時に「○○は対応していません。」などの警告が出ますが、無視していただいてかまいません。

そうすると、拡張子が元の「*.doc」とは別に「*.htm」という拡張子のファイルと「*.files」というフォルダができるはずです。このフォルダの中に画像が生成されていますので、この中から必要な画像を取り出してやればよいのです。そして、必要な画像のみ「*.files」のフォルダとは別の場所にコピーしておいて、作業が終わった後は、この「*.htm」という拡張子のファイルはごみ箱に捨ててかまいません。そうすると、「*.files」というフォルダも対になって一緒に削除されます。これらの作業は、もちろんWORD文書を最新の状態で元のWORD形式で保存した後で行ってください。そうしないと更新する前のWORDしか残りませんのでご注意を。

ただし、このフォルダの中にはWORDがプレビュー用に独自に作成した低解像度の縮小画像も含まれていますので、画像のファイル容量が大きいもの(≒高解像度の画像)を選ぶという選別が必要になります。一般的には「*.png」という拡張子の付いたファイルが高解像度のようです(文書の状況により必ずしも「*.png」というファイルができるわけではないようです)。これに比べるとgula君の方法は余計な画像が生成されないので、選別の必要がないという点で優れています。ちなみに、画像の名前は「image001.png」、「image002.jpg」…、などオリジナルの画像とは違う名前になっていますので、開いて中身を確認していくしかありません。なお、この番号は画像の文書中の出現順に連番で付けられるようです。

しかし、文書によっては、この方法で保存しても、低解像度の「*.gif」という拡張子の画像しか得られず、何やら正体不明の、ダブルクリックしても開けない「*.wmz」という拡張子のファイルができてしまうものもあります。これもどうやら圧縮ファイルのようで、これをさらに拡張子を「*.zip」に変えて解凍してやると、中から拡張子のないファイルが現れます。これを「*.jpg」などに変えてやると、「*.gif」よりも高解像度の画像が得られるようです。でもこのファイルがたくさんある場合には、ファイルのリネームソフトで一括して拡張子を変えてまとめて解凍する方が効率的でしょう。

もう一つのやり方としては、Microsoft社のホームページのDownload Centerから、「Microsoft Office互換機能パック」というアプリをダウンロードしてきて、これをインストールしてやると、WORD2003などでもWORD2007-2010のファイル形式(*.docx)で保存することができるようになるので、こうして変換した文書の拡張子を「*.zip」に変えてやれば、gula君の方法で画像がまとめて取り出せます。

この互換機能パックを入れることで、WORD2003でもWORD2007-2010のファイルを開くことができるようになるので、入れる価値は大いにあります。ただ、互換機能パックの対象がWORDの2000、2003としかホームページ上に示されていないようなので、WORD97で使えるのかどうかはわかりません。あと、Office関連の最新のアップデートをした上でインストールする必要があるようですので、この点にも注意が必要です。

おわりに

印刷会社のDTPの現場では、WORDから画像を取り出して加工したり、暗い色の画像を明るめに補正したりといったことは日常茶飯事で行われていて、今回ご紹介したWORDを「*.htm」形式で保存して必要な画像を取り出すという方法は以前から使っています。WORD2007ー2010が主流になって久しいですが、gula君の紹介してくれた、画像を取り出す方法によってこれらの作業の手間が少なくなるのは歓迎すべきことです。みなさんも機会があったらぜひ自分でこの方法を試してみてください。では今回はこの辺で。

コメント

タイトルとURLをコピーしました