זוהי תרגום מכונה של המסמך המקורי באנגלית. במקרה של סתירה בין תרגום זה לבין הגרסה המקורית באנגלית, הגרסה באנגלית היא הקובעת. קרא את הגרסה המקורית באנגלית
קול: לדבר ולהקשיב
רוצים שה-AI יקרא תגובות בקול רם? או להכתיב הודעות במקום להקליד? Caiioo מציעה קלט ופלט קולי — הכל ניתן להגדרה, וחלק מהאפשרויות רצות מקומית על המכשיר שלכם.

פלט קולי (Text-to-Speech)
אפשר ל-AI להקריא את תגובותיו בקול. בחר מבין האפשרויות הבאות:
| אפשרות | סוג | איכות | הגדרה |
|---|---|---|---|
| Browser Voices | מקומי | בסיסית | חינם, ללא הגדרה |
| Kokoro | מקומי | גבוהה | חינם, פועל על המכשיר שלך |
| Gemini 3.1 Flash TTS | ענן | טבעית | הוסף מפתח API של OpenRouter |
| ElevenLabs | ענן | פרימיום | הוסף את מפתח ה-API שלך |
| Cartesia (Sonic 3.5) | ענן | פרימיום | הוסף את מפתח ה-API שלך |
| Resemble.ai | ענן | מצוינת (שיבוט קול) | הוסף את מפתח ה-API שלך |
גודל הורדה של Kokoro: מודל ה-Kokoro מגיע בשתי גרסאות, והגרסה שתורד תלויה בפלטפורמה שלך. macOS ו-iOS טוענות את המודל הקטן יותר בקוונטיזציית INT8 (כ-88 MB), בעוד שהתוסף/דפדפן משתמש בגרסת ה-WebGPU המלאה והגדולה יותר (כ-330 MB). זוהי הורדה חד-פעמית.
הערות פלטפורמה:
- iOS native Kokoro (גרסה v0.9.720+): פועל בתהליך המארח של iOS באמצעות OnnxRuntime במקום ב-WebView, מה שפתר קריסות ב-iPhone 13/14.
- macOS Kokoro: מזרים שמע משפט אחר משפט (תוך כ-שנייה מרגע הלחיצה על נגן) דרך תהליך העזר של שולחן העבודה.
- Gemini TTS (גרסה v0.9.723+): דרך OpenRouter — כעת מנגן משפט אחר משפט, כך שהשמע מתחיל לאחר המשפט הראשון במקום להמתין לסיום העיבוד של התגובה כולה.
- Cartesia (גרסה v0.9.723+): מפתח API אחד מפעיל הן את Sonic 3.5 (פלט) והן את Ink (קלט). אין קול ברירת מחדל — יש לבחור אחד ב-Settings > Voice לפני ההפעלה.
מהירות השמעה: בורר המהירות (0.5×–2.0×) מוחל על ידי הספק עבור ElevenLabs (מוגבל ל-0.7–1.2×) ועבור Cartesia (מוגבל ל-0.6–1.5×). Browser voices ו-Kokoro מאיצים את השמע באופן מקומי; ל-Resemble.ai ול-Gemini אין בקרת מהירות והם תמיד מנגנים בקצב רגיל.
כדי להפעיל:
- עבור אל Settings > Voice
- בחר באפשרות text-to-speech
- הפעל את "Auto-read responses" אם ברצונך שה-AI יקריא אוטומטית
- התאם את מהירות ההשמעה לפי העדפתך
אם ההשמעה נכשלת: שגיאות קוליות מופיעות כעת כהודעת "toast" במקום להיכשל בשקט — כך שמפתח API חסר או לא תקין, או קול שאינו תואם למודל שנבחר (נפוץ ב-Resemble.ai וב-Cartesia), יגידו לך בדיוק מה עליך לתקן.
מקומי מול ענן: Browser voices ו-Kokoro לעולם אינם שולחים דבר מחוץ למכשיר שלך. Gemini, ElevenLabs, Cartesia, ו-Resemble.ai שולחים טקסט לשרתים שלהם (תוך שימוש במפתחות ה-API שלך) כדי לייצר את השמע. ראה Privacy & Data לפרטים נוספים.
עלויות קול (TTS + STT) מחושבות כ-voice_cost בשיחה, בהתאם למסלול ה-one-shot.
קלט קולי (דיבור לטקסט)
הכתב את ההודעות שלך במקום להקליד. לחץ על אייקון המיקרופון בתיבת הכתיבה כדי להתחיל להקליט. Caiioo מתמלל את מה שאתה אומר ומכניס אותו לשדה ההודעה.
בחר כיצד הוא מתמלל:
| אפשרות | סוג | פרטיות | הגדרה |
|---|---|---|---|
| Whisper (דפדפן) | מקומי | פרטי לחלוטין | חינם, רץ על המכשיר שלך |
| WhisperKit (iOS) | מקומי | פרטי לחלוטין | חינם, על המכשיר |
| whisper.cpp & Moonshine (Android) | מקומי | פרטי לחלוטין | חינם, על המכשיר |
| Browser Speech | מקומי | פרטי | חינם, מובנה |
| ElevenLabs Scribe | ענן | מדויק (מעולה לשפות שאינן אנגלית) | הוסף מפתח API של ElevenLabs |
| Cartesia Ink | ענן | מדויק, השהיה נמוכה | הוסף מפתח API של Cartesia |
אפשרויות מקומיות שומרות את האודיו שלך מקומי — שום דבר לא נשלח לשרת. ElevenLabs ו-Cartesia שולחות אודיו לשרתים שלהן לתמלול (באמצעות מפתח ה-API שלך) ומציעות דיוק גבוה יותר, במיוחד לשפות שאינן אנגלית.
כדי להשתמש בזה:
- לחץ על אייקון המיקרופון בתיבת הכתיבה
- אמור את ההודעה שלך
- עצור כשתסיים
- התמלול יופיע בשדה ההודעה
- ערוך במידת הצורך, ואז שלח
הגדרה ראשונית: בפעם הראשונה שמשתמשים במודל דיבור על המכשיר, עליו לרדת ולהתחמם. תיבת הכתיבה מציגה את ההתקדמות ("מוריד מודל דיבור… N%", ואז "מכין"/"טוען"), לכן השהיה קצרה בלחיצה הראשונה על המיקרופון היא צפויה.
הכתבה כלל-מערכתית (macOS)
מנויי Pro ב-macOS יכולים גם להתקין את PrivateVoice, אפליקציה נלווית נפרדת שמוסיפה מקש קיצור גלובלי של "לחץ כדי לדבר" להכתבה לכל אפליקציה — לא רק ל-Caiioo. ראה את דף ההורדה לשולחן העבודה לפרטים.
ראה גם
- פרטיות ונתונים — כיצד מטופלים נתוני קול
- פלטפורמה והגדרה — זמינות אפליקציית שולחן עבודה ו-PrivateVoice
- הגדרות > קול — הגדר אפשרויות קול עבור המערכת שלך
This guide is maintained by the Caiioo team using Slate, our built-in editor.