Přehled
Většina nahraných souborů se převede do PDF (pokud ještě ve formátu PDF nejsou) a zobrazují se v zobrazení Dokumenty jako dokumenty PDF.
U nezvukových formátů služba Pinpoint z nahraného souboru extrahuje text pomocí optického rozpoznávání znaků (OCR).
Zvukové soubory služba Pinpoint pomocí technologie převodu řeči na text přepíše podle jazyka zvukových souborů nakonfigurovaného pro sbírku.
Do služby Pinpoint lze nahrát následující typy souborů. Každý typ souboru je omezen maximální velikostí a sadou podporovaných formátů. Pokud soubor překročí limit velikosti, bude odmítnut a po pokusu o nahrání se zobrazí varování.
- PDF (včetně skenů, textu a obrázků ve formátu PDF)
- Zvuk
- Video (extrahuje a přepisuje se zvuk, video se neukládá)
- E‑mail
- Obrázek
- Webová stránka
- Dokumenty Google (dokumenty a prezentace)
- Microsoft Office (Word, Excel, PowerPoint)
- Prostý text (nikoli text v PDF)
Pinpoint dokáže analyzovat tištěný nebo ručně psaný text v souborech PDF a také text v obrázcích vložených v souboru PDF.
Google provádí analýzu OCR (optické rozpoznávání znaků) u veškerého obsahu PDF, včetně obrázků a ručně psaného textu. Jazyk jakéhokoli nalezeného textu bude odvozen. Nemusíte měnit žádná nastavení sbírky, aby odpovídala jazyku souboru PDF. Soubor PDF může dokonce obsahovat text v různých jazycích.
Při skenování papírů k nahrání se snažte stránky co nejvíce vyrovnat, a pokud je to možné, zajistěte, aby stránky byly v běžné orientaci pro čtení (neotáčejte je o 90 stupňů). Dobré jednoduché pravidlo je, že byste skeny měli sami dokázat snadno přečíst.
Maximální velikost souboru: 1 GB
Rozdělení souborů
Zdrojové soubory větší než 500 MB (kromě zvukových) budou rozděleny do menších dokumentů PDF a každý z nich se v zobrazení dokumentů bude zobrazovat samostatně.
Zdrojové soubory do 500 MB se spoustou textových informací (například soubor PDF o velikosti 21 MB se 7 000 stránkami textu) budou také rozděleny do více souborů.
Zvuk
Do služby Pinpoint můžete nahrát zvukové soubory, abyste z nich vytvořili přepis s možností vyhledávání (a stažení).
Po zpracování je zvukový soubor ve sbírce k dispozici jako textový přepis s vloženým audiopřehrávačem pro nahraný soubor.
Přepis si můžete stáhnout tak, že ho otevřete a poté kliknete na položku nabídky > Stáhnout přepis.
Další poznámky:
- Ze zvukového souboru lze extrahovat pouze jeden jazyk. Tento jazyk je určen nastavením jazyka mluvené řeči ve zvukových souborech pro sbírku (viz níže).
Podporované formáty zvuku: MP3, MP4, M4A, WAV, FLAC, WMA, AAC, RA, RAM, AIF, AIFF, OGG
Maximální velikost souboru: 8 GB nebo 2 hodiny zvuku při přehrávání normální rychlostí, podle toho, která hodnota je nižší.
Postup nahrání zvukového souboru:
- Nejdříve se ujistěte, že je jazyk pro nahrávání zvukových souborů nastaven na jazyk souborů, které chcete nahrát.
- Běžným způsobem soubory nahrajte. Zvukové soubory lze nahrát hromadně společně se soubory jiného typu.
- Pokud automaticky vygenerovaný přepis není správně, můžete ho ve službě Pinpoint upravit kliknutím na Upravit.
Video
Nahráním videosouborů do služby Pinpoint vytvoříte přepis, ve kterém lze vyhledávat a který je možné stahovat.
Při zpracování se extrahuje zvukový soubor a vytvoří se z něj textový přepis ve vaší sbírce doplněný vloženým přehrávačem zvuku.
Přepis si můžete stáhnout tak, že ho otevřete a poté kliknete na položku nabídky > Stáhnout přepis.
Další poznámky:
- Z videosouboru lze extrahovat pouze jeden jazyk. Tento jazyk je určen nastavením jazyka mluvené řeči ve zvukových souborech pro sbírku (viz níže).
Podporované formáty videa: MP4, MPEG, MOV, WMV, AVI, 3GPP, WEBM, MP2T, FLV, OGV, MKV, M4V.
Maximální velikost souboru: 8 GB nebo 2 hodiny videa při přehrávání normální rychlostí, podle toho, která hodnota je nižší.
Postup nahrání videosouboru:
- Nejdříve se ujistěte, že je jazyk pro nahrávání zvukových souborů nastaven na jazyk souborů, které chcete nahrát.
- Běžným způsobem soubory nahrajte. Videosoubory lze nahrát hromadně společně se soubory jiného typu.
- Pokud automaticky vygenerovaný přepis není správně, můžete ho ve službě Pinpoint upravit kliknutím na Upravit.
E‑maily
Uložené e‑maily můžete do služby Pinpoint nahrát ve formátech uvedených níže, nebo můžete e‑mail uložit do formátu PDF a nahrát ho jako PDF.
Pokud nahraný e‑mail obsahuje přílohy, budou při prohlížení dokumentu ve službě Pinpoint k dispozici, ale obsah příloh se nezpracovává a nelze v něm pomocí služby Pinpoint vyhledávat.
Podporované formáty: EML, MBOX
Obrázky
V nahraných obrázcích se vyhledá text a nahrané obrázky se do sbírky uloží jako dokumenty PDF. Následující formáty souborů můžete nahrát přímo. Můžete také nahrát obrázky vložené do souboru PDF s jiným obsahem nebo bez jiného obsahu (s obrázky se zachází stejně bez ohledu na to, zda je nahrajete jednotlivě, nebo vložené do jiného souboru). Pokud máte ručně psané stránky nebo poznámky, můžete je nahrát buď jako prosté obrázky, nebo jako obrázky vložené do PDF.
Podporované formáty: JPG, PNG, GIF, BMP, TIFF
Maximální velikost souboru: 10 MB
Webové stránky
Stažené webové stránky lze nahrát včetně vložených obrázků. Je třeba zvolit správné formátování a formát souboru podle toho, zda při nahrávání chcete zahrnout obrázky. Není možné nahrát živou stránku z internetu pomocí adresy URL. Je třeba stáhnout místní kopii a tu potom nahrát do služby Pinpoint.
V Chromu uložíte místní kopii webové stránky tak, že ji otevřete, kliknete na Soubor > Uložit stránku jako a vyberte jednu z možností. Možnost Pouze HTML nenahraje obrázky, styly a dynamické prvky, jako jsou komentáře uživatelů. Jiné možnosti tyto dodatečné položky a formátování mohou uložit. Pokud si nejste jisti, který formát použít, zkuste uložit kopii v každém formátu a poté ji zobrazit v prohlížeči. Některé možnosti mohou stránku uložit také jako složku s několika soubory. Takovou možnost Pinpoint nepodporuje – pro webovou stránku můžete nahrát pouze jeden soubor.
Podporované formáty: HTML, MHT, MHTML
Dokumenty Google
Je možné přidat dokumenty a prezentace Google. Soubory budou převedeny do statického formátu PDF a přidány do vaší sbírky. Změny provedené v dokumentech a prezentacích Google po přidání se ve sbírce neprojeví.
Podporované formáty: Dokumenty Google, Prezentace Google
Maximální velikost souboru: 10 MB
Microsoft Office
Lze nahrávat soubory sady Microsoft Office. Soubory je potřeba nahrát z počítače. Není možné nahrát webový soubor Office 365 pomocí adresy URL.
Podporované formáty: DOC, DOCX (Word); XLS, XLSX (Excel); PPT, PPTX (PowerPoint)
Maximální velikost souboru: 10 MB
Prostý text
Následující typy souborů prostého textu lze nahrát přímo. V případě textu vloženého do souboru PDF nebo do jiného souboru platí pravidla pro formát souboru, do kterého je text vložen.
Podporované formáty: TXT, RTF, CSV
Maximální velikost souboru: 10 MB