Se, hvordan Google forbedrer talemodeller

Mange af Googles produkter omfatter talegenkendelse. Google Assistent giver dig f.eks. mulighed for at bruge stemmen til at bede om hjælp, mens Gboard giver dig mulighed for at diktere beskeder til dine venner, og Google Meet leverer automatiske undertekster til dine møder.

Taleteknologier benytter sig i stadig højere grad af dybe neurale netværk, som er en form for maskinlæring, der hjælper os med at udvikle mere nøjagtige og hurtigere modeller til talegenkendelse. Dybe neurale netværk kræver generelt store mængder data for at fungere godt og blive bedre over tid. Denne forbedringsproces kaldes modeloplæring.

Teknologier, vi bruger til at oplære talemodeller

Googles taleteam bruger 3 brede teknologiklasser til at oplære talemodeller: Konventionel læring, samlet læring og kortvarig læring. Nogle af disse er mere effektive end andre, afhængigt af hvilken opgave og situation de bruges til, og i nogle tilfælde bruger vi en kombination af dem. Det gør det muligt for os at opnå den bedst mulige kvalitet og giver samtidig indbygget privatlivsbeskyttelse.

Konventionel læring

Konventionel læring bruges til oplæringen af de fleste af vores talemodeller.

Sådan bruges konventionel læring til at oplære talemodeller

  1. Lydeksempler indsamles og gemmes på Googles servere med dit udtrykkelige samtykke.
  2. Et udsnit af disse lydeksempler annoteres af menneskelige kontrollanter.
  3. En oplæringsalgoritme lærer af de annoterede lyddataeksempler.
    • Oplæring under tilsyn: Modellerne oplæres til at efterligne annoteringer fra menneskelige kontrollanter for den samme lyd.
    • Oplæring uden tilsyn: Maskinannoteringer bruges i stedet for menneskelige annoteringer.

Når lige store mængder data oplæres, resulterer oplæring under tilsyn normalt i bedre modeller til talegenkendelse end oplæring uden tilsyn, da annoteringerne er af højere kvalitet. På den anden side kan oplæring uden tilsyn lære af flere lydeksempler, da modellerne lærer af maskinannoteringer, som er nemmere at producere.

Sådan beskyttes dine personlige oplysninger

Se, hvordan Google beskytter dine data.

Samlet læring

Samlet læring er en teknik, der beskytter personlige oplysninger, og som er udviklet af Google til at oplære AI-modeller direkte på din telefon eller en anden enhed. Vi bruger samlet læring til at oplære en talemodel, når modellen kører på din enhed, og der er tilgængelige data, som modellen kan lære af.

Sådan bruges samlet læring til at oplære talemodeller

Med samlet læring oplærer vi talemodeller uden at sende dine lyddata til Googles servere.

  1. Vi gemmer dine lyddata på din enhed for at muliggøre brugen af samlet læring.
  2. En oplæringsalgoritme lærer af disse data på din enhed.
  3. Der oprettes en ny talemodel ved at kombinere den samlede læring fra din enhed med læring fra alle andre deltagende enheder.

Sådan beskyttes dine personlige oplysninger

Se, hvordan dine tale- og lyddata forbliver private, mens Google Assistent forbedres.
Kortvarig læring
Kortvarig læring er en teknik til beskyttelse af personlige oplysninger, som vi bruger, når talemodellen kører på Googles servere.

Sådan bruges kortvarig læring til at oplære talemodeller

  1. Efterhånden som vores systemer konverterer indgående lydeksempler til tekst, sendes disse eksempler til korttidshukommelsen (RAM).
  2. Mens dataene er i RAM, lærer en oplæringsalgoritme af disse lyddataeksempler i realtid.
  3. Disse lyddataeksempler slettes fra korttidshukommelsen inden for få minutter.

Sådan beskyttes dine personlige oplysninger

Med kortvarig læring gælder følgende for dine lyddataeksempler:

  • De gemmes kun i korttidshukommelsen (RAM) og højst i et par minutter.
  • Ingen mennesker har adgang til dem.
  • De gemmes aldrig på en server.
  • De bruges til at oplære modeller uden yderligere data, der kan identificere dig.

Sådan kan Google bruge og investere i disse teknologier

Vi fortsætter med at bruge alle 3 teknologier – ofte kombineret med hinanden for at opnå en højere kvalitet. Vi arbejder også aktivt på at forbedre både samlet og kortvarig læring til taleteknologier. Vores mål er at gøre dem mere effektive og nyttige på måder, der som standard beskytter brugernes personlige oplysninger.

Søgning
Ryd søgning
Luk søgning
Hovedmenu
11188509734294844057
true
Søg i Hjælp
true
true
true
true
true
1633398
false
false