קרדיט: דרו אנגרר/Getty Images
PCMag.com היא סמכות מובילה בתחום הטכנולוגיה, ומספקת ביקורות עצמאיות מבוססות מעבדות על המוצרים והשירותים העדכניים ביותר. ניתוח התעשייה המומחה שלנו והפתרונות המעשיים שלנו עוזרים לך לקבל החלטות קנייה טובות יותר ולהפיק יותר מהטכנולוגיה.
האם אתה חושב על יצירת אפליקציה מונעת על ידי בוט דיבור עבור העסק שלך? חלק מההנחיות לגבי יצירת בוטים - כפי שתוארו ב-Microsoft Build על ידי היזמית השוודית, הפודקאסטר וה-MVP של פיתוח פלטפורמות Windows, ג'סיקה אנגסטרום - הן הגיון בריא. לדוגמה, אל תבנה בוט קולי רק בגלל שזו טכנולוגיה חדשה ומגניבה, וודא שהיא מתאימה למודל העסקי שלך.
אבל יש הרבה תרחישים שבהם הקול כן מתאים. אחת הטענות היא שהאדם הממוצע מקליד 40 מילים בדקה אבל מדבר 150. כ-3,000 בוטים חדשים משוחררים בשבוע רק בפלטפורמת מיקרוסופט, ו-95 אחוז מבעלי הסמארטפונים ניסו עוזר אישי.
עם זאת, לא הכל שיט חלק. אנגסטרום הזכיר את ניסוי הקול פלוס-AI האסון של מיקרוסופט, Tay, אשרהחברה נאלצה למשוךתוך פחות מיממה לאחר שהאינטרנט לימד אותו להיות גזעני. והיא הצביעה על בורגר קינג, אשרניהל פרסומתתוכנן להפעיל את Google Home אך במקום זאת קרא דף ויקיפדיה שאומר שה-Woper מכיל ציאניד.
בעת תכנון עוזר קולי, עליך להגביל את היקף התשובות האפשריות, אמר אנגסטרום. אל תשאלו שאלות פתוחות. אמן את העוזרת הקולית לטפל בדרכים רבות לניסוח שאלה או פקודה. אפילו כתוב תסריט מלא של שיחה הגיוני עבור הבוט שלך. לבסוף, ספק עזרה אודיו, מתן דוגמאות לסוג הדברים שמשתמש יכול לומר.
חדש עבור טכנולוגיית Azure Speech
אחת ההכרזות הגדולות ב-Build Keynote הייתה היכולת לתמלל נאום מרובה צדדים בפגישות תוך מעקב אחר הדובר שאמר מה. בפגישה נפרדת, Aarthy Longino, מנהל תוכניות ראשי לדיבור ושפה במיקרוסופט, הראה את זה עובד בממשק פיתוח מותאם אישית.
מהירות אור ניתנת לריסוק
ב-Build בשנה שעברה, הלהיט הגדול ביותר היה "קונוס" פגישה שזיהה את המשתתפים ותמלל את מה שכל אחד אמר. כעת החרוט הזה, שמכיל גם מצלמת 360 מעלות, נבדק על ידי לקוחות מיקרוסופט בתצוגה מקדימה פרטית. אבל יש מכשירים אחרים שכל אחד יכול להשיג כדי לבדוק את התמלול, כוללRoobo Smart Audio Dev Kit, שהודגמה בצורה מרשימה במושב.
אתה יכול למצוא מכשירי דיבור אלה של שירותי קוגניטיביים בכתובתaka.ms/sdsdk-get.
בצד השני של הדיבור, ולפחות מרשים, נמצא טקסט לדיבור (TTS). Qinying Liao של מיקרוסופט, מנהל תוכנית ראשי בשירותי דיבור, הראה התקדמות בדברים כמו הקולות העצביים החדשים להפליא, שהיו כה חלקים שהמשתתפים בחדר הצביעו עבורו על פני קורא אנושי אמיתי.
נכון לעכשיו, קולות עצביים זמינים רק עבור תשעה דיאלקטים באנגלית אזוריים, אבל יפנית, ספרדית ופורטוגזית נמצאים בתהליכי עבודה.
יכולת חדשה נוספת היא להוסיף רגש ל-TTS: מילת מפתח פשוטה בקוד יכולה לגרום לקול שנוצר להישמע עליז או אמפתי. זה עובד גם בכיוון השני. למעשה, טכנולוגיות התמלול של מיקרוסופט למוקדים טלפוניים יכולות לזהות מתי אינטראקציה מתחילה להיות שלילית. שירותי הדיבור יאפשרו לעסקים להתאים אישית את הזיהוי וה-TTS תוך שימוש בטרמינולוגיה משלהם בפורטל דיבור מותאם אישית חדש. תוכל לקרוא על כל שירותי הדיבור של Azure בכתובתדף העזרה הזה.
ניוזלטרים אלה עשויים להכיל פרסומות, עסקאות או קישורי שותפים. בלחיצה על הירשם, אתה מאשר שאתה בן 16+ ומסכים לנותנאי שימושומדיניות פרטיות.