Mempelajari cara Google meningkatkan model ucapan

Banyak produk Google menggunakan pengenalan ucapan. Misalnya, Asisten Google memungkinkan Anda meminta bantuan dengan suara, Gboard memungkinkan Anda mendikte pesan kepada teman Anda, dan Google Meet menyediakan teks otomatis untuk rapat Anda.

Teknologi ucapan makin bergantung pada jaringan neural dalam, suatu jenis machine learning yang membantu kami mengembangkan model pengenalan ucapan yang lebih akurat dan cepat. Umumnya jaringan neural dalam memerlukan jumlah data yang lebih besar agar dapat berfungsi dengan baik dan meningkat sepanjang waktu. Proses peningkatan ini disebut pelatihan model.

Teknologi yang kami gunakan untuk melatih model ucapan

Tim ucapan Google menggunakan 3 kelas teknologi yang luas untuk melatih model ucapan: pembelajaran konvensional, pembelajaran federasi (federated learning), dan pembelajaran efemeral. Tergantung tugas dan situasinya, beberapa pembelajaran lebih efektif daripada yang lainnya, dan dalam beberapa kasus, kami menggunakan perpaduannya. Hal ini memungkinkan kami mencapai kualitas terbaik, sekaligus memberikan privasi bawaan desain.

Pembelajaran konvensional

Pembelajaran konvensional adalah cara sebagian besar model ucapan kami dilatih.

Cara kerja pembelajaran konvensional untuk melatih model ucapan

  1. Dengan persetujuan eksplisit dari Anda, sampel audio dikumpulkan dan disimpan di server Google.
  2. Sebagian dari sampel audio ini dianotasi oleh peninjau manual.
  3. Algoritme pelatihan belajar dari sampel data audio yang dianotasi.
    • Dalam pelatihan yang diawasi: Model dilatih untuk meniru anotasi dari peninjau manual untuk audio yang sama.
    • Dalam pelatihan yang tidak diawasi: Anotasi mesin digunakan, bukan anotasi manual.

Dalam melatih jumlah data yang sama, pelatihan yang diawasi biasanya menghasilkan model pengenalan ucapan yang lebih baik daripada pelatihan yang tidak diawasi karena kualitas anotasi lebih tinggi. Di sisi lain, pelatihan tanpa pengawasan dapat belajar dari sampel audio yang lebih banyak karena pelatihan mempelajari anotasi mesin yang lebih mudah dihasilkan.

Cara privasi data Anda dijaga

Pelajari lebih lanjut cara Google menjaga privasi data Anda.

Pembelajaran federasi

Pembelajaran federasi adalah teknik untuk menjaga privasi yang dikembangkan di Google untuk melatih model AI langsung di ponsel Anda atau perangkat lain. Kami menggunakan pembelajaran federasi untuk melatih model ucapan saat model berjalan di perangkat Anda dan data tersedia untuk dipelajari oleh model tersebut.

Cara kerja pembelajaran federasi untuk melatih model ucapan

Dengan pembelajaran federasi, kami melatih model ucapan tanpa mengirimkan data audio ke server Google.

  1. Untuk mengaktifkan pembelajaran federasi, kami menyimpan data audio Anda di perangkat Anda.
  2. Algoritme pelatihan belajar dari data ini di perangkat Anda.
  3. Model ucapan baru dibentuk dengan menggabungkan pembelajaran yang dikumpulkan dari perangkat Anda bersama dengan pembelajaran dari semua perangkat lain yang ikut serta.

Cara privasi data Anda dijaga

Pelajari bagaimana data suara & audio Anda tetap dijaga privasinya, sembari Asisten Google ditingkatkan.
Pembelajaran efemeral
Pembelajaran Efemeral adalah teknik untuk menjaga privasi yang kami gunakan saat model ucapan berjalan di server Google.

Cara kerja pembelajaran efemeral untuk melatih model ucapan

  1. Saat sistem kami mengonversi sampel audio yang masuk menjadi teks, sampel tersebut dikirim ke memori jangka pendek (RAM).
  2. Saat data berada dalam RAM, algoritme pelatihan mempelajari sampel data audio tersebut secara real time.
  3. Sampel data audio ini dihapus dari memori jangka pendek dalam hitungan menit.

Cara privasi data Anda dijaga

Dengan pembelajaran efemeral, sampel data audio Anda:

  • Hanya ditahan di memori jangka pendek (RAM) dan tidak lebih dari beberapa menit.
  • Tidak dapat diakses oleh manusia.
  • Tidak pernah disimpan di server.
  • Digunakan untuk melatih model tanpa data tambahan yang dapat mengidentifikasi Anda.

Cara Google menggunakan & berinvestasi dalam teknologi ini

Kami akan terus menggunakan ketiga teknologi ini, sering kali dengan satu sama lain, untuk menghasilkan kualitas yang lebih tinggi. Kami juga berupaya secara aktif untuk meningkatkan pembelajaran federasi dan efemeral untuk teknologi ucapan. Tujuan kami adalah untuk membuatnya lebih efektif dan berguna, sekaligus menjaga privasi secara default.

Perlu bantuan lain?

Coba langkah-langkah selanjutnya berikut:

Telusuri
Hapus penelusuran
Tutup penelusuran
Aplikasi Google
Menu utama
12539316552466151419
true
Pusat Bantuan Penelusuran
true
true
true
true
true
1633398
false
false