Bu belge, orijinal İngilizce metnin makine çevirisidir. Bu çeviri ile orijinal İngilizce sürüm arasında herhangi bir çelişki olması durumunda, İngilizce sürüm geçerli olacaktır. İngilizce orijinal metni oku
Ses: Konuşun ve Dinleyin
AI'nın yanıtları yüksek sesle okumasını mı istiyorsunuz? Yoksa mesajları yazmak yerine dikte etmek mi? Caiioo sesli giriş ve çıkış sunar — hepsi yapılandırılabilir, bazıları cihazınızda yerel olarak çalışır.

Ses Çıkışı (Metinden Konuşmaya)
Yapay zekanın yanıtlarını yüksek sesle okumasını sağlayın. Şunlar arasından seçim yapın:
| Seçenek | Tür | Kalite | Kurulum |
|---|---|---|---|
| Tarayıcı Sesleri | Yerel | Temel | Ücretsiz, kurulum gerektirmez |
| Kokoro | Yerel | Yüksek | Ücretsiz, cihazınızda çalışır |
| Gemini 3.1 Flash TTS | Bulut | Doğal | OpenRouter API anahtarı ekleyin |
| ElevenLabs | Bulut | Premium | API anahtarınızı ekleyin |
| Cartesia (Sonic 3.5) | Bulut | Premium | API anahtarınızı ekleyin |
| Resemble.ai | Bulut | Mükemmel (ses klonlama) | API anahtarınızı ekleyin |
Kokoro indirme boyutu: Kokoro modeli iki varyant halinde sunulur ve hangisinin indirileceği platformunuza bağlıdır. macOS ve iOS daha küçük olan INT8-quantized modeli (~88 MB) yüklerken, uzantı/tarayıcı daha büyük olan tam hassasiyetli WebGPU yapısını (~330 MB) kullanır. Bu tek seferlik bir indirmedir.
Platform notları:
- iOS yerel Kokoro (v0.9.720+): WebView yerine OnnxRuntime aracılığıyla iOS ana sürecinde çalışarak iPhone 13/14 çökmelerini giderir.
- macOS Kokoro: Masaüstü yardımcı süreci aracılığıyla cümle cümle (oynata bastıktan sonra ~1 sn içinde) akış gerçekleştirir.
- Gemini TTS (v0.9.723+): OpenRouter aracılığıyla — artık cümle cümle oynatılır, böylece ses tüm yanıtın sentezlenmesini beklemek yerine ilk cümleden sonra başlar.
- Cartesia (v0.9.723+): Tek bir API anahtarı hem Sonic 3.5 (çıkış) hem de Ink (giriş) özelliklerini çalıştırır. Varsayılan bir ses yoktur; etkinleştirmeden önce Ayarlar > Ses bölümünden bir ses seçin.
Oynatma hızı: Hız sürgüsü (0.5×–2.0×), ElevenLabs (0.7–1.2× aralığına sabitlenmiş) ve Cartesia (0.6–1.5× aralığına sabitlenmiş) için sağlayıcı tarafından uygulanır. Tarayıcı sesleri ve Kokoro yerel olarak hızlanır; Resemble.ai ve Gemini hız kontrolüne sahip değildir ve her zaman normal hızda oynatılır.
Etkinleştirmek için:
- Ayarlar > Ses bölümüne gidin
- Bir metinden konuşmaya seçeneği belirleyin
- Yapay zekanın otomatik olarak okumasını istiyorsanız "Yanıtları otomatik oku" seçeneğini açın
- İsterseniz oynatma hızını ayarlayın
Oynatma başarısız olursa: Ses hataları artık sessizce başarısız olmak yerine bir bildirim (toast) olarak görünür; böylece eksik veya geçersiz bir API anahtarı ya da seçilen modelle uyumlu olmayan bir ses (Resemble.ai ve Cartesia'da yaygındır) size tam olarak neyi düzeltmeniz gerektiğini söyler.
Yerel ve Bulut Karşılaştırması: Tarayıcı sesleri ve Kokoro hiçbir veriyi cihazınızın dışına göndermez. Gemini, ElevenLabs, Cartesia ve Resemble.ai, sesi oluşturmak için metni (sizin API anahtarlarınızı kullanarak) kendi sunucularına gönderir. Detaylar için Privacy & Data sayfasına bakın.
Ses maliyetleri (TTS + STT), tek seferlik yolla eşleşecek şekilde konuşma üzerinde voice_cost olarak toplanır.
Sesli Giriş (Konuşmadan Metne)
Mesajlarınızı yazmak yerine dikte edin. Kaydı başlatmak için oluşturucudaki mikrofon simgesine tıklayın. Caiioo söylediklerinizi metne dönüştürür ve mesaj alanına bırakır.
Nasıl dönüştürüleceğini seçin:
| Seçenek | Tür | Gizlilik | Kurulum |
|---|---|---|---|
| Whisper (Tarayıcı) | Yerel | Tamamen gizli | ÜCRETSİZ, cihazınızda çalışır |
| WhisperKit (iOS) | Yerel | Tamamen gizli | ÜCRETSİZ, cihaz üzerinde |
| whisper.cpp & Moonshine (Android) | Yerel | Tamamen gizli | ÜCRETSİZ, cihaz üzerinde |
| Tarayıcı Konuşma | Yerel | Gizli | ÜCRETSİZ, yerleşik |
| ElevenLabs Scribe | Bulut | Doğru (İngilizce dışı için harika) | ElevenLabs API anahtarınızı ekleyin |
| Cartesia Ink | Bulut | Doğru, düşük gecikme | Cartesia API anahtarınızı ekleyin |
Yerel seçenekler (Whisper, WhisperKit, whisper.cpp, Moonshine, Tarayıcı Konuşma) sesinizi yerelde tutar; hiçbir sunucuya gönderilmez. ElevenLabs ve Cartesia, transkripsiyon için sesi kendi sunucularına gönderir (API anahtarınızı kullanarak) ve özellikle İngilizce dışındaki diller için daha yüksek doğruluk sunar.
Kullanmak için:
- Oluşturucudaki mikrofon simgesine tıklayın
- Mesajınızı söyleyin
- Bitirdiğinizde durdurun
- Metin mesaj alanında görünür
- Gerekirse düzenleyin ve gönderin
İlk kurulum: Cihaz içi bir konuşma modelini ilk kez kullandığınızda, modelin indirilmesi ve hazırlanması gerekir. Oluşturucu ilerlemeyi gösterir ("Konuşma modeli indiriliyor... %N", ardından "Hazırlanıyor"/"Yükleniyor"), bu nedenle ilk mikrofon dokunuşunuzda kısa bir duraklama beklenir, bu bir donma değildir.
Sistem Genelinde Dikte (macOS)
macOS'taki Pro aboneleri, yalnızca Caiioo'ya değil, herhangi bir uygulamaya dikte etmek için küresel bir bas-konuş kısayol tuşu ekleyen ayrı bir yardımcı uygulama olan PrivateVoice'u da yükleyebilirler. Ayrıntılar için masaüstü indirme sayfasına bakın.
Ayrıca Bakınız
- Gizlilik ve Veri — Ses verilerinin nasıl işlendiği
- Platform ve Kurulum — Masaüstü uygulaması ve PrivateVoice kullanılabilirliği
- Ayarlar > Ses — Kurulumunuz için ses seçeneklerini yapılandırın
This guide is maintained by the Caiioo team using Slate, our built-in editor.