概要
アップロードされたほとんどのファイルは、PDF 形式でない場合は PDF に変換され、[ドキュメント] ビューに PDF ドキュメントとして公開されます。
音声以外のファイル形式の場合、Pinpoint は OCR(光学式文字認識)を使用して、アップロードされたファイルからテキストを抽出します。
音声ファイルの場合、Pinpoint はコレクションの音声ファイルの言語設定に従い、音声文字変換技術を使用して音声ファイルを文字起こしします。
次のファイルタイプは Pinpoint にアップロードできます。各ファイルタイプには、最大ファイルサイズと、一連のサポートされている形式があります。ファイルがサイズ上限を超えた場合、ファイルは拒否され、アップロードの試みの後に警告が表示されます。
- PDF(PDF 形式のスキャン、テキスト、画像を含む)
- 音声
- 動画(音声は抽出および文字起こしされ、動画は保存されない)
- メール
- 画像
- ウェブページ
- Google ドキュメント(ドキュメント、スライド)
- Microsoft Office(Word、Excel、PowerPoint)
- 書式なしテキスト(PDF 内のテキストは対象外)
Pinpoint は、PDF ファイル内の印刷されたテキストや手書きのテキスト、さらには埋め込み画像のテキストも分析できます。
Google は、画像や手書きのテキストを含め、PDF のすべてのコンテンツに対して OCR(光学式文字認識)分析を実行します。検出されたテキストの言語は推測されるため、PDF ファイルの言語に対応するためにコレクションの設定を変更する必要はありません。また、PDF ファイルに複数の言語が混在していても構いません。
アップロードする書類をスキャンする際は、できる限りページを平らにして、普段読むときと同じ向きを維持するようにしてください(ページを 90 度回転させないでください)。スキャンした内容が自分にとって読みやすいかどうかを基準にすることをおすすめします。
最大ファイルサイズ: 1 GB
ファイルの分割
500 MB を超えるソースファイル(音声ファイルを除く)は、小さな PDF ドキュメントに分割され、各 PDF は [ドキュメント] ビューに別々に表示されます。
500 MB 未満で文字情報の多いソースファイル(21 MB の PDF ファイルに 7,000 ページのテキストが含まれる場合など)も、複数のファイルに分割されます。
音声
音声ファイルを Pinpoint にアップロードして、検索可能(ダウンロード可能)な文字起こしを作成できます。
処理が終了すると、音声ファイルは文字起こしとしてコレクションで公開され、アップロードされたファイルには埋め込みのオーディオ プレーヤーが表示されます。
文字起こしをダウンロードするには、文字起こしを開き、 メニュー項目 > [文字起こしをダウンロード] をクリックします。
追加情報:
- 音声ファイルから抽出できるのは 1 つの言語のみです。この言語は、コレクションの [音声ファイルの音声の言語] の設定で指定されています(以下を参照)。
サポートされている音声ファイル形式: MP3、MP4、M4A、WAV、FLAC、WMA、AAC、RA、RAM、AIF、AIFF、OGG
最大ファイルサイズ: 8 GB または 2 時間(通常の速度で再生した場合)のいずれか小さい方
音声ファイルをアップロードするには:
- 音声ファイルのアップロード言語が、アップロードするファイルの言語に設定されていることを確認します。
- 通常の方法で 1 つまたは複数のファイルをアップロードします。音声ファイルは音声以外のファイルとまとめてアップロードできます。
- Pinpoint で自動生成された文字起こしに間違いがあった場合は、[編集] をクリックして文字起こしを編集できます。
動画
動画ファイルを Pinpoint にアップロードして、検索可能(ダウンロード可能)な文字起こしを作成できます。
処理中に音声ファイルが抽出され、それを使用してコレクションに文字起こしが作成されます。音声ファイルには埋め込みのオーディオ プレーヤーが表示されます。
文字起こしをダウンロードするには、文字起こしを開き、 メニュー項目 > [文字起こしをダウンロード] をクリックします。
追加情報:
- 動画ファイルから抽出できるのは 1 つの言語のみです。この言語は、コレクションの [音声ファイルの音声の言語] の設定で指定されています(以下を参照)。
サポートされている動画のファイル形式: MP4、MPEG、MOV、WMV、AVI、3GPP、WEBM、MP2T、FLV、OGV、MKV、M4V
最大ファイルサイズ: 8 GB または 2 時間(通常の速度で再生した場合)のいずれか小さい方
動画ファイルをアップロードするには:
- 音声ファイルのアップロード言語が、アップロードするファイルの言語に設定されていることを確認します。
- 通常の方法で 1 つまたは複数のファイルをアップロードします。動画ファイルは動画以外のファイルとまとめてアップロードできます。
- Pinpoint で自動生成された文字起こしに間違いがあった場合は、[編集] をクリックして文字起こしを編集できます。
メール
保存したメールは、以下で指定した形式で Pinpoint にアップロードできます。または、メールを PDF 形式で保存し、PDF としてアップロードすることもできます。
アップロードしたメールに添付ファイルがある場合、Pinpoint でドキュメントを閲覧する際に利用できます。ただし、Pinpoint では添付ファイルの内容は処理されず、検索もできません。
サポートされている形式: EML、MBOX
画像
アップロードされた画像はテキストがないかスキャンされ、コレクション内に PDF ドキュメントとして保存されます。次のファイル形式は直接アップロードできます。また、PDF に埋め込まれた画像も、それのみで、または他のコンテンツと一緒にアップロードできます(画像は個別にアップロードされた場合でも、別のファイルに埋め込まれている場合でも、同じように扱われます)。手書きのページやメモがある場合、画像自体として、または PDF に埋め込まれた画像としてアップロードできます。
サポートされている形式: JPG、PNG、GIF、BMP、TIFF
最大ファイルサイズ: 10 MB
ウェブページ
ダウンロードしたウェブページは、埋め込み画像とともにアップロードできます。アップロードに画像を含めるかどうかによって、適切な書式設定とファイル形式を選択する必要があります。URL を指定してインターネットから公開中のページをアップロードすることはできません。ローカルにダウンロードしてから Pinpoint にアップロードする必要があります。
Chrome でウェブページをローカルに保存するには、[ファイル] > [ページを別名で保存…] をクリックして、いずれかのオプションを選択します。[HTML のみ] を選択すると、画像、スタイル、または動的要素(ユーザー コメントなど)はアップロードされません。その他のオプションでは、これらの追加の項目や書式設定が保存されます。どの形式を使用すべきかわからない場合は、各形式でコピーを保存してから、ブラウザで表示してみてください。一部のオプションでは、複数のファイルで構成されたフォルダとしてページが保存されます。この形式は Pinpoint ではサポートされていないため、ウェブページごとに 1 つのファイルのみをアップロードしてください。
サポートされている形式: HTML、MHT、MHTML
Google ドキュメント
Google ドキュメントと Google スライドも追加できます。ファイルは静的な PDF 形式に変換され、コレクションに追加されます。追加後に Google ドキュメントと Google スライドに加えられた変更は、コレクションには反映されません。
サポートされている形式: Google ドキュメント、Google プレゼンテーション
最大ファイルサイズ: 10 MB
Microsoft Office
Microsoft Office ファイルはアップロードできます。ファイルはパソコンからアップロードする必要があります。ウェブ上で公開されている Office 365 ファイルを、URL を指定してアップロードすることはできません。
サポートされている形式: DOC、DOCX(Word)、XLS、XLSX(Exce)、PPT、PPTX(PowerPoint)
最大ファイルサイズ: 10 MB
書式なしテキスト
次の形式の書式なしテキストは直接アップロードできます。PDF または他のコンテナ ファイル内に埋め込まれたテキストがある場合、コンテナ ファイル形式のルールが適用されます。
サポートされている形式: TXT、RTF、CSV
最大ファイルサイズ: 10 MB