Qlingo で、PDF (*.pdf) を原稿ファイルとして登録した場合の翻訳対象、その翻訳結果をご紹介します。
§01 : 翻訳できないファイル
ここでは、翻訳できない PDF ファイルについて、説明します。
† : 翻訳できない可能性が高い PDF ファイルも含みます
- 閲覧にパスワードの入力が必要なファイル :
ファイルを閲覧しようとしたときにパスワードが求められる場合があります。こうしたファイルは、直接翻訳することはできません。このようなファイルを翻訳しようとすると、プロジェクト作成画面 で閲覧に必要なパスワードを入力するよう求められますので、パスワードを入力してから翻訳を開始してください。 - ページ数の多い PDF ファイル :
Microsoft Word などのアプリケーションで作成した文書を PDF ファイルとして保存したものと、紙に印字・印刷された文書をスキャナーで PDF として保存しただけの PDF ファイルは、ページ数が多いと、翻訳できないケースがあります。レイアウトや文字の大きさ、原稿の精度(明瞭さ)などによって、一度に翻訳できるページ数は異なりますが、およそ以下のとおりです。- アプリケーションで作成した文書を PDF ファイルとして保存したもの : 20 – 30 ページ程度
30 ページ以上だと、原稿の抽出に失敗する可能性が高くなります。 - 紙の原稿をスキャンし、PDF ファイルとして保存したもの : 5 – 10 ページ程度
10 ページ以上だと、原稿の抽出に失敗する可能性が高くなります。
ページ数の多い PDF で、直接翻訳ができない場合は、PDF ツール > PDF 分割 にファイルをアップロードして、適切なページ数にファイルを分割してから翻訳をおこなってください。
† : 詳しくは、PDF ツールについて(PDF → MS Office 変換 / PDF 分割) > §03 : PDF 分割でできること をご参照ください - アプリケーションで作成した文書を PDF ファイルとして保存したもの : 20 – 30 ページ程度
- ファイルの保存状態に問題のあるファイル :
ごくまれにファイルの保存状態に問題のあるファイルである場合があります。こうしたファイルは、普通に閲覧はできることも多いのですが、ファイルの構造が破損しているために翻訳できない場合があります。問題がなさそうな場合であっても、翻訳できない場合は、ファイルを開いてから、別名で保存することで、ファイル構造が正常化し、翻訳可能な状態になる場合もあります。
§01-01 : PDF からテキストのみを抽出する
前述のアプリケーションで作成した文書を PDF ファイルとして保存したものでページ数の多い PDF ファイルなどが対象となりますが、プロジェクト作成 のメッセージ中の PDFからテキストのみを抽出 をクリックすると、原稿のレイアウトの維持はできませんが、PDF 上のテキストのみを抽出し、翻訳可能です。
論文や契約書など、レイアウトやデザインの維持を必要としない文書には、適しています。
† : 紙に印字・印刷された文書をスキャナーで PDF として保存しただけの PDF ファイルからは、テキストのみの抽出はできません
§02 : 原文・訳文ファイルの扱い
Qlingo ではファイル原稿を翻訳する場合、元のファイル形式を維持して、訳文ファイルも同じファイル形式で作成します。
† : [原文]Microsoft Word – *.docx → [訳文]Microsoft Word – *.docx
PDF ファイルから翻訳する場合、その原稿ファイルからプロジェクト作成する際に Microsoft Word (*.docx) / Excel (*.xlsx) / PowerPoint (*.pptx) ファイルのいずれかに変換可能です。これらのファイルを元に自動翻訳をおこない、編集可能な Microsoft Word (*.docx) / Excel (*.xlsx) / PowerPoint (*.pptx) 形式で訳文ファイルとして出力します。
- 原稿ファイル : PDF (*.pdf)
- 原文ファイル(プロジェクト一覧からダウンロード) :
Microsoft Word (*.docx) / Excel (*.xlsx) / PowerPoint (*.pptx) - 訳文ファイル(プロジェクト一覧からダウンロード) :
Microsoft Word (*.docx) / Excel (*.xlsx) / PowerPoint (*.pptx)
原稿ファイル / 変換された原文ファイル / 訳文ファイルのサンプルをご用意しています。§05 : 原文と訳文のサンプル をご参照ください。
† : PDF から Microsoft Word / Excel / PowerPoint ファイルに変換する際に、テキストのカーニング(文字と文字の間隔)がおかしくなる(異常に間隔が狭くなってしまい、可読性が低下する)、原稿ファイルでは改行されていた箇所が改行されない、または逆に改行していない箇所が改行される、……といったことも発生する可能性があります(不要な改行は、自動翻訳の障害となります / Cf. : マニュアルの ユーザガイド > Qlingo とうまく付き合うコツ ページの §01 : 不必要な改行 をご参照ください)
§03 : 文字修飾・書式
ここでは、Microsoft PowerPoint (*.pptx) に記述されたテキストが、Qlingo の訳文ファイルでどのように表示されるかを説明します。
原文例(イメージ) | 訳文例(イメージ) | ||
---|---|---|---|
スタイルなし | — | このページでは、Qlingoでできることについて説明します。 | This page describes what you can do with Qlingo. |
フォント | — | このページでは、Qlingoでできることについて説明します。 このページでは、Qlingoでできることについて説明します。 |
This page describes what you can do with Qlingo. This page describes what you can do with Qlingo. |
現時点では、Serif(Times New Roman や MS P 明朝など)のフォントが指定されたテキストも、San-Serif(Arial や MS P ゴシックなど)のフォントが指定されたテキストも、訳文ファイルでは San-Serif(ゴシック体)となります。 | |||
フォントサイズ | このページでは、Qlingoでできることについて説明します。 このページでは、Qlingoでできることについて説明します。 このページでは、Qlingoでできることについて説明します。 |
This page describes what you can do with Qlingo. This page describes what you can do with Qlingo. This page describes what you can do with Qlingo. |
|
文頭に文字色 | — | このページでは、Qlingoでできることについて説明します。 | This page describes what you can do with Qlingo. |
文頭に文字色を設定した場合、その文全体に文字色が適用されます。 † : 太字 / 斜体 / 下線 / 取り消し線 / 文字の効果と体裁 / 蛍光ペンの色 も同様に、文頭にこれらのスタイルを設定した場合、文全体に適用されます |
|||
文中に文字色 | このページでは、Qlingoでできることについて説明します。 | This page describes what you can do with Qlingo. | |
文中に文字色を設定した場合、その文字色は適用されません。 † : 太字 / 斜体 / 下線 / 取り消し線 / 文字の効果と体裁 / 蛍光ペンの色 / 文字の網掛け / 囲み線も同様に、文中にこれらのスタイルを設定した場合、文全体に適用されません |
§04 : その他の要素について
ここでは、その他の要素が Qlingo で翻訳対象となるかどうかについて説明します。
- 翻訳対象 :
- Microsoft Word に変換した際に、テキストとして認識されたもの
- コメント(PDF 原稿を作成する前に、Microsoft Word で追加したコメント)
- 翻訳対象外 :
- 画像(画像化された文字も含む)
- ワードアート(PDF 原稿を作成する前に、Microsoft Word で追加したワードアート)
§05 : 原文と訳文のサンプル
このページで紹介した代表的な要素について、原文ファイルと訳文ファイルのサンプルをご用意しました。また、元の原稿ファイルである PDF (*.pdf) 形式のファイルもご用意しています。
この原稿 / 原文 / 訳文ファイルを比較することで、どのように原稿のレイアウト / スタイルを維持して翻訳できるのかのイメージも確認することができます。
† : プロジェクト名 = 6666666666 としています
- 原稿ファイル : [O]6666666666.pdf
- 原文ファイル : [D]6666666666.docx
- 訳文ファイル : [T]6666666666.docx