[日誌] 特許出願図面取り込み自動化に向けて(1)
図面取り込み(1)〜画像フォーマットの考察〜
やりたいこと
特許出願用図面をきれいに簡単にほぼ自動で取り込めるようにしたい。できれば、PDF化した図面をWordのマクロ1ボタンで取り込みたいということを目標に考察します(実践したことがないので考察)。3回くらいに分けて書いてみます。今回は画像フォーマット編です。
ビットマップ vs. jpeg
特許出願に限らず利用できる内容だと思いますが、許容されているサイズが法域で異なるため、今回は特許出願、しかもPCT出願ではない国内出願を例に考察します。
まず、特許庁が許容している画像フォーマットとして代表的なものとして、ビットマップ(bmp)とjpegとの2つがあります。前者が、モロクロ2値、後者がグレースケール256階調という特徴を有しています。モノクロ2値の画像フォーマットととしては、pngとgifもありますが、bmpと変わりはないので代表でbmpで書いていきます。
長所及び短所
上述のようにbmp, jpegは、階調が異なるのですが、それ以外も特徴があるので、pros and consで表にまとめてみます。
画像フォーマット | 長所 | 短所 |
---|---|---|
bmp | ・(誤差拡散をすることにより)画像劣化が少ない ・線画に対してくっきり表示する ・(参考)PCTの国際公報がモノクロ2値で公開されるため同じ内容で表示される | ・Wordとの拡縮の相性が悪い |
jpeg | ・写真画像に強い ・Wordとの拡縮の相性が良い | ・線画 に弱い ・(参考)PCTの国際公開では、勝手にモノクロ2値かされ、画像が汚くなる |
決定的な違いは、jpegは、圧縮をブロック領域ごとに行うため、線画などのイラストを圧縮すると若干モザイク状になってしまうことです。jpegは線画がくっきりでないため、特許庁(イメージファイルの規定*3)も図面代用写真以外は、bmpを使うことを推奨しています。
bmpの取り込み
bmpの画像取り込みにおいて、残念なのがMicrosoft Wordとの相性の悪さです。正確に言うと特許出願に使うインターネット出願ソフトとWordとの画像ファイルの取り扱い方法の違いです。jpegの場合、なぜかWordに取り込んでも解像度を考慮した貼り付けになり、インターネット出願ソフトと同じような出力になるのに対して、(モノクロ2値の)bmpは、なぜかWordが解像度を考えない拡大・縮小を実施します。インターネット出願ソフトのドット数だけから解像度を考える仕様とあいまって、更にbmpの出願にみなさんも悩まされているのではないかと思います。
インターネット出願ソフトの特性
ここで300dpiのbmpを取り込むことを前提に考察します。インターネット出願ソフトが、300dpiであると認識する範囲は、横が1339〜2007ドット、縦が2008〜3011ドットのどちらかを満たし、縦も横もいずれも上限を超えないことです。横1339ドット縦10ドットでも解像度300dpiと解釈されます。横10ドット縦10ドットは解像度200dpi、横2008ドット縦2009ドットは解像度400dpiです。
Wordの特性
図面を取り込む際にWordはある程度以上の画像に関して横幅に合わせて取り込もうとするようです。A4サイズ(210x294mm)で余白を左右20mmとったものと仮定します。図面の実寸が最大170x255mmであることから、本文の横幅に170mmを確保するための余白です。Word文書は、画面解像度(通常、96dpi)に対して拡縮の計算を行うため、300dpiの場合、96dpi / 300dpi = 0.32の縮小が、適切な表示倍率です。2007x100dotsの画像を読み込むと適切な32%の表示でWord上に表示されていることがわかります。
一方、1339x100dotsの画像を取り込むと、48%で表示されていることがわかります。
つまりWord文書に300dpiの画像を読み込むときには、読み込んだ後に画像を32%に倍率変更しなければならないことがわかります。Word文書にマクロで取り込むときにこの32%に設定してあげれば、bmpでもインターネット出願ソフトと同じ大きさの画像をWord文書で表示することができるということです。
まとめ
今回は、特許出願の図面等における画像フォーマットと、インターネット出願ソフトの解像度の仕様と、Wordの特性(仕様なのですが、明確でないため)との話になりました。
次は、いよいよpdfからbmpに自動的に切り抜きできるのではないかという話になります。きっとほとんどの特許事務所がこの辺りで改善策を図りたいと思っているのではないでしょうか。ImageMagickを使っての切り抜き自動化を考察してみたいと思います。