GoogleDriveOCR、縦書きだったらどうなのよ?

一つ前の記事

無料でOCR(光学文字認識)したかったらGoogleDriveを試してみるといいかもね

のブコメに「縦書きに対応してたらいいのにね」的な言葉を頂戴しまして、そういや検証してなかったなと思いデータ作って試してみました。

スポンサーリンク

やっぱ縦書は…

前の記事と同じテキストをフォトショで縦書きにしてみました。画像サイズ等スキャン想定条件も同じにしてます。ノイズ加えただけのものがこちら。

同じ方法で変換かけて取り出したテキストがこちら。

守干宝彦首語は一 』丑、 衆読を一 六三に解散する迄とを決め誌『 衆読選は十二芹L丑ハム一耐]十六ヨ量 開票の日程で実施される』 嘉三党が政権交代を果騰し掘』一〇〇九年其月以来、 約三年ぶりで、 東京都知 事選と投票日が重なるダブ 丿選挙となる』 脱原発や消費税増税、 憲法改正の是非が二 な争点『 な曲な勤 進まない東日本大震災の抽災地の再建や東京電力福島第一 原発事故の処理を投げ出し~ 震災後、 初の本 相的韓国政選挙に突入する』

首距は十L ヨの党曽富論で、 宙宝党の安倍晋二一総裁やハム明党の山口那津男代表に対し、 赤字国損の発 行を可能にする装置発行特例法案の十六白までの成立や、 最高裁が 「違憲状態」 とし詰衆院小選挙区の 「一 票の格差」 星其と衆院議員の定敷削減に協力を要請し詰。

さらに、 自相は定敷削減が今国会でまとまらない場合、 来年の通常国会で実現し、 それまでの間は国 会議員歳費を二割削減するよう提案し 「必ずやると決断してもらえるなら、 十六日に解散してもいい」 と表明し距離 安倍氏は 兄首討論では確約を避け話が、 その後、 党幹部と協議し、 首相の提案を受け入れる方針を決 め誌。 安倍氏は都内の講演で 「首相の提案に全面的に協力する」 と述べ誌『 山口氏も記者会見で同様の 考えを示し距離

仁れを受け、 政府-謹三党は三段ム 議を聞き、 選挙日程を決定『 安住淳幹事長代行は議員歳費を二割 削減する法案を十五日に国会へ提出する方針を記者団に明ら動にし距離

一方、 嘉三、 善宝、 華謹三党は十』 丑、 衆院の 「一 票の格差」 是正の韓め ハ選挙区を 「〇増五城」 す る法案と装置法案を十五日の衆院本』 議で可決し〟 参読に送付する方針で大筋合意し話。 十六日の参院 本会議などで成立する運び捕縄 「〇増五減」 法案は成立するが、 区割りの見直しが問に合わず、 今度の 衆院選は現行のまま実施される〟

ぐぬぅ、さすがに縦書き日本語は酷いもんだ。

ちなみに同じ画像をさらに自由変形で斜めって波紋フィルタで変形したものがこちら。

変換後のテキストが

野田佳彦首相は十四日、 衆院を十六日に謹する通とを決め距離 衆院選は十二月四臓殻電 「主ハ量

開票の田程で実施される〟 民主党が政権交代を果躍し電 縄曾九年暁月以来~ 約三電離りで〝 東京都知 事選と投票日が重なるダブ施選挙となる『 脱騰躍や韓費税増税~ 嘉改正の是非が主韓壽『 な湖なか 進まない東日本大震施の墓地即再建や東京電力蓋第] 原謡事故の蛙理を投げ出L~ 韓誕後、 初の本 横的な国政選挙に突入する”

首相は十四円の党首討論で] 自民党の縄葉倍晋コ語読や製明党即山口霊男韓表に対し~ 赤宇宙偵の謡 行を可能にする融憤発行持制辞彙の十六日まで曲成立や~ 景』間我が 「連謹態」 とし詰衆院小選挙区の 「}唖離の梶離嬲」 是正と衆院議費の定鏡削減に協力を要請し需

さら構、 首相は定数削減湖今踊会でまとまら輝い場合『 来年の通常隅会で実現し~ 指曲までの間は国 会議員歳費を二割削減するよう捉案し 「必ずやると決断してもらえるなら、 主ハ日に解散してもいい」 と表明し韓』

安倍氏は彗論では確約を避け話が~ その後~ 党幹部と協識し、 畠の提案を受け鬼れる方針を決 め韓 安堂は都内の講演で 「首相の提案に語富に協力する」 と述べ距離 山口氏も曲典者会見で岡横堀 考えを示し韓『

これを受け~ 政府’民主党は五識ム濃説を聞き、 選挙田程を決縄止『 安住博幹事長代行は議員歳費を牽制 削減する講案を十五日に国会へ提出する方針を記静岡に明らかにした』

]方、 民主] 自民~ 武明王党は十四日『 衆院の 「 』 票融格差」 是正のため小選挙踊を 「頭増五城」 す る法案と強償法案を十五日の衆院王=議で可決し] 参院に送付す暮方針で大筋ム=意した離 十宜慣の華院

‘ ー 査=議などで威典=守る運び躍『 「融増荘減」 法案は成立するが』 区割り融見直しが開拓合わず『 今度の 衆離選は現行鞄まま実施さ牡る『

もういよいよ何書いてるかわかりませんなw

というわけでGoogleDriveOCRでは当面横書きオンリーで使うことになりそうです。調べといて良かった。あ、スキャン高解像度の場合のパターンとかやってないですけどあまり期待は出来なさそうですね、ファイルサイズの上限もあるし…誰か試してレポしてくれたらうれしいですけど。

んじゃまた。




スポンサーリンク

シェアする

  • このエントリーをはてなブックマークに追加

フォローする

スポンサーリンク