Qlingo ニューズレター > #019 : PDF サーバの処理能力向上

以前も同じような内容でお伝えしました(Qlingo ニューズレター > #006 : PDF の翻訳について §01)が、Qlingo では 2022/01/26 に PDF の処理能力のさらなる改善をおこないました。

Qlingo では、PDF 原稿を元に翻訳がリクエスト された場合、前処理としてその PDF ファイルを Microsoft Word の Word 文書 (.docx) の形式に変換します。このファイルの変換にそこそこ時間が必要なので、一定の待機時間を設定し、その時間内に処理できなければタイムアウト として、PDF ファイルの分割をお願いしておりました。この処理時間を最大 5 分まで延長しました。これにより、いままでタイムアウトになっていたようなページ数の多い PDF の前処理でも問題なく Word 文書 (.docx) の形式に変換可能で、 翻訳がおこなえるプロジェクトが増えてきました。200 ページを超えるような PDF であっても、問題なく翻訳可能なケースもあるようです。
: 変換処理に 5 分以上かかるようなファイルは、適宜 PDF のファイル分割をお願いいたします

◯◯ページであれば分割不要! とシンプルにお伝えできればよいのですが、こればかりは試してみていただかないと何とも言えない状況は変わっていません。先ほど 200 ページを超えても問題ない PDF ファイルもある……と書きましたが、150 ページ未満でもタイムアウトする事例もちらほらあるようです。なので、残念ながら◯◯ページ以内は分割不要……と言えないのが現状です。

Microsoft Word などのアプリケーション(ソフトウェア)で作成した PDF であれば 100 ページを超えてもタイムアウトにならないケースが多いようですが、紙に出力された原稿をスキャナーでスキャンしただけのデータの場合は 30 ページ程度でもタイムアウトになることも多いようです(変換処理にかかる時間が圧倒的に長くなってしまいます)。
: 紙に出力された原稿をスキャナーでスキャンしただけのデータ の場合でもタイムウトを回避できる場合もあります。詳しくは、 Qlingo ニューズレター > #006 : PDF の翻訳について §01 / #007 : PDF の翻訳について §02 をご参照ください

以下のようなメッセージが表示された場合は、PDF の分割が必要です。同じファイルで再度プロジェクト作成しようとしても同じ結果になりますので、PDF の分割をご検討ください。
Qlingo : Qlingo ニューズレター > #019 : PDF サーバの処理能力向上 : アラートメッセージ 01

このメッセージが表示された場合は、PDF の変換サーバが他のユーザの方によって使用されている(混み合っている)状態ですので、後ほど再度お試しください。
Qlingo : Qlingo ニューズレター > #019 : PDF サーバの処理能力向上 : アラートメッセージ 02