Qlingo では、PDF ファイルを翻訳する際に、内部処理として以下のステップで前処理をおこなっていました。
- STEP 01 : PDF の原稿ファイル を Microsoft Word の Word 文書 (.docx) に変換(Qlingo からダウンロードできる 原文ファイル)
- STEP 02 : この原文ファイルから原稿を抽出し、翻訳を実行
- STEP 03 : Word 文書 (.docx) の原文ファイルのレイアウト中の翻訳前のテキスト(原文)と翻訳結果(訳文)を差し替え(Qlingo からダウンロードできる訳文ファイル)
その結果、翻訳完了後には 編集可能な原文と訳文の Word 文書 (.docx) のファイル(原稿ファイルとほぼ同じレイアウト)がダウンロードできます。
これまでの Qlingo では、すべての PDF ファイルを一律 Word文書 (*.docx) に変換していましたが、2022/06/23 のリリースで、
- Word ファイルから作成した PDF : Word 文書 (.docx)
- Excelファイルから作成した PDF : Excel ブック (.xlsx)
- PowerPoint ファイルから作成した PDF : PowerPoint プレゼンテーション (.pptx)
……に変換できるようになりました。PDF ファイルの翻訳をおこなわれた方は、その機能をすでにご覧になられているかもしれません。
プロジェクト作成 の画面で、PDF 原稿を登録すると、以下のようなインターフェイスが表示されます。
画面下部の テキストの抽出 のボタンをクリックして、翻訳を開始しますが、このすぐ上に以下のラジオボタンが表示されます。
このラジオボタンで、PDF 原稿の変換先のファイル形式を選択できます。
縦長のファイルであれば Word に、横長のファイルであれば PowerPoint にするのがよいかもしれません。また、表組みの記載された原稿 PDF の場合は、Excel をお選びいただくのがよいかもしれません。
PDF の作成方法にはさまざまな方式があり、PDF ファイルを見ても、その原稿が Word で作成されたものなのか、Excel、PowerPoint なのかの判断がつかないファイルも多々あります。それ以外のソフトウェア(Adobe InDesign など)で作成したファイルからの PDF かもしれません。あるいは、ブラウザで閲覧していた画面を PDF で出力したファイルである場合もありえます。
このような元ファイルがどのソフトウェアで作成したものなのかが不明な PDF ファイルは、
- 縦長の PDF : Word (*.docx)
- 横長の PDF : PowerPoint (*.pptx)
……が、先ほどのラジオボタンで優先的に選択されます。変換先のファイルタイプは、ラジオボタンで変更可能になっていますので、ご希望に応じて変更してください。
PowerPoint で作成した PDF ファイル、または横長の PDF ファイルの場合、変換先ファイルは、PowerPoint (*.pptx) が選択された状態で表示されます。
サンプルファイルをご用意しましたので、お試しいただければと存じます。
- PDF_EXCEL_SAMPLE.pdf : 地方税共同機構 : eLTAX(エルタックス) のウェブサイト からダウンロードした Excel ブック (.xlsx) を PDF 出力したもの
- PDF_POWERPOINT_SAMPLE.pdf : U.S. DEPARTMENT OF LABOR のウェブサイト からダウンロードした PowerPoint プレゼンテーション (.pptx) を PDF 出力したもの
いままでは、一律 Microsoft Word (*.docx) に変換していましたので、一部のファイルでレイアウトが乱れてしまうケースがありましたが、変換先を指定することで、そのようなケースは減少するものと思われます。また、ダウンロードした訳文ファイルの編集も容易になるかもしれません。
† : 翻訳することで、原文よりも訳文が長くなってしまい、レイアウトが乱れてしまうケースはどうしても発生してしまいます。ご容赦ください
変換結果だけを見たい場合は、Qlingo の画面左のメニューから PDF ツール をクリックして利用できる PDF ツール > PDF → MS Office 変換 でも、同様の変換機能をご用意しておりますので、ぜひお試しください。