Birçok Google ürününde konuşma tanıma özelliği bulunur. Örneğin, Google Asistan sesli komut kullanarak yardım istemenize, Gboard, arkadaşlarınıza göndereceğiniz mesajları sesle yazmanıza olanak tanır. Google Meet ise toplantılarınız için otomatik altyazılar sağlar.
Konuşma teknolojileri, derin nöral ağları gittikçe daha fazla kullanmaktadır. Bu, daha doğru ve daha hızlı konuşma tanıma modelleri geliştirmemize yardımcı olan bir makine öğrenimi türüdür. Derin nöral ağların iyi performans göstermesi ve zamanla iyileşmesi için genellikle daha büyük miktarlarda veriye ihtiyaç vardır. Bu iyileşme sürecine model eğitimi denir.
Konuşma modellerini eğitmek için kullandığımız teknolojiler
Google'ın konuşma ekibi, konuşma modellerini eğitmek için geleneksel öğrenim, birleşik öğrenim ve geçici öğrenim olmak üzere 3 kapsamlı teknoloji sınıfı kullanır. Göreve ve duruma bağlı olarak bunların bazıları diğerlerinden daha etkilidir. Bazı durumlarda ise bunları birlikte kullanırız. Böylece, tasarımdan başlayan gizlilik yaklaşımını uygularken bir yandan da mümkün olan en iyi kaliteyi sunabiliriz.
Geleneksel öğrenimKonuşma modellerimizin çoğunu eğitirken geleneksel öğrenimden yararlanırız.
Geleneksel öğrenim, konuşma modellerini eğitmek için nasıl kullanılır?
- Sizden açıkça izin alındıktan sonra ses örnekleri toplanarak Google'ın sunucularında depolanır.
- Bu ses örneklerinin bir bölümüne, gerçek kişi olan incelemecilerin ek açıklamaları dahil edilir.
- Eğitim algoritması, ek açıklamalı ses verisi örneklerinden bilgi alır.
- Gözetimli eğitimde: Modeller, aynı ses için gerçek kişi olan incelemecilerin ek açıklamalarını taklit edecek şekilde eğitilir.
- Gözetimsiz eğitimde: Gerçek kişilerin ek açıklamalarının yerine makine ek açıklamaları kullanılır.
Eşit miktarlarda veriyle eğitim sağlandığında, gözetimli eğitim genellikle gözetimsiz eğitimden daha iyi konuşma tanıma modelleri ortaya çıkarır. Bunun nedeni, ek açıklamaların daha kaliteli olmasıdır. Öte yandan, gözetimsiz eğitim daha kolay üretilebilen makine ek açıklamalarına dayandığı için daha fazla ses örneğinden bilgi alabilir.
Verilerinizin gizliliği nasıl sağlanır?
Google'ın verilerinizi nasıl gizli tuttuğu hakkında daha fazla bilgi edinin.
Birleşik öğrenim, AI modellerini doğrudan telefonunuzda veya diğer cihazlarınızda eğitmek için Google tarafından geliştirilen bir gizlilik koruma tekniğidir. Konuşma modeli, cihazınızda çalıştığında ve modelin öğreneceği veriler mevcut olduğunda modeli eğitmek için birleşik öğrenimden yararlanırız.
Birleşik öğrenim, konuşma modellerini eğitmek için nasıl kullanılır?
Birleşik öğrenimde, ses verilerinizi Google'ın sunucularına göndermeden konuşma modellerini eğitiriz.
- Birleşik öğrenimi kullanabilmek için ses verilerinizi cihazınıza kaydederiz.
- Bir eğitim algoritması, cihazınızdaki bu verilerden bilgi edinir.
- Cihazınızdan öğrenilenler toplanır ve katılan diğer tüm cihazlardan öğrenilenlerle birleştirilerek yeni bir konuşma modeli oluşturulur.
Verilerinizin gizliliği nasıl sağlanır?
Google Asistan daha iyi hale getirilirken konuşma ve ses verilerinizin nasıl gizli kaldığını öğrenin.Geçici öğrenim, konuşma modellerini eğitmek için nasıl kullanılır?
- Sistemlerimiz gelen ses örneklerini metne dönüştürdükçe bu örnekler kısa süreli belleğe (RAM) gönderilir.
- Veriler RAM'deyken bir eğitim algoritması bu ses verisi örneklerinden gerçek zamanlı olarak bilgi alır.
- Bu ses verisi örnekleri birkaç dakika içinde kısa süreli bellekten silinir.
Verilerinizin gizliliği nasıl sağlanır?
Geçici öğrenimde ses verisi örnekleriniz:
- Yalnızca kısa süreli bellekte (RAM) en fazla birkaç dakika tutulur.
- Hiçbir zaman gerçek kişiler tarafından erişilemez.
- Hiçbir zaman sunucuda depolanmaz.
- Kimliğinizi tanımlayabilecek ek veriler olmadan modelleri eğitmek için kullanılır.
Google bu teknolojileri nasıl kullanacak ve bunlara nasıl yatırım yapacak?
3 teknolojiyi de kullanmaya devam edeceğiz. Daha yüksek kalite için genellikle bunları birlikte kullanacağız. Ayrıca konuşma teknolojileri için hem birleşik hem de geçici öğrenimi iyileştirmek amacıyla aktif olarak çalışıyoruz. Amacımız, bu teknolojileri daha etkili ve faydalı hale getirirken varsayılan olarak gizliliğin korunmasını sağlamaktır.