איך מתרגם Skype עובד
תוכן עניינים:
מדע בדיוני מלא בהתייחסויות למכשירים מתקדמים טכנולוגית שפעולתם, בפרפראזה על הביטוי המיתי, אינה ניתנת להבדלה מקסם. כתוצאה מהמוח היצירתי של המחברים שלהם, קשה לדמיין מתי המצאות כאלה יכולות להיות בידינו ובסופו של דבר אנחנו מקבלים את זה שקיומן לא יהפוך לחלק ממחזור החיים שלנו. אבל מדי פעם אחד מהם מתגנב לחיינו בטרם עת. זה המקרה של התרגום בזמן אמת שמיקרוסופט וסקייפ עומדות לאפשר
"המשימה היא הכל חוץ מפשוטה.זה כרוך ביכולת של סקייפ לנהל ועידה בווידאו, הרשת העצומה של שרתי הענן של Microsoft Azure, החידושים הטכנולוגיים של Microsoft Research וההתקדמות האחרונה בתחומים רבים כמו סטטיסטיקה ולמידת מכונה. כל זה עומד לשירותכם, כך שברגע שאתם מבטאים משפט בשפה שלכם, המערכת תזהה את מה שאתם אומרים, מתרגמת אותו ותעביר אותו לאיש הקשר שלכם בשפה אחרת. איך זה אפשרי?"
הטכנולוגיה שמאפשרת זאת
מתרגם סקייפ, השם שבו ידועה הפונקציונליות החדשה, אינו הבזק, אפילו לא בעוד שנה . מתרגם Skype הוא תוצאה של עשרות שנים של מחקר בזיהוי דיבור, תרגום מכונה וטכניקות למידת מכונה. בכל התחומים הללו מונחת הפעלת מערכת שלא הייתה אפשרית ללא ההתקדמות האחרונה בהם.
מתרגם Skype הוא תוצאה של עשרות שנים של מחקר בזיהוי דיבור, תרגום מכונה וטכניקות למידת מכונה.מתחילים ב-זיהוי דיבור, טכנולוגיה שנחקרת כבר זמן מה, אך אימוצה תמיד הושפע מהמספר הרב של שגיאות ורגישות יתר של מערכות קיימות. שנייה של ספק, וריאציות קטנות במבטא, או מינימום רעש הספיקו כדי לבלבל את המחשב ולגרום לו להבין מה הוא רוצה. כך זה היה עד שהתפוצץ הפיתוח של טכניקות 'למידה עמוקה' ויצירת רשתות עצביות מלאכותיות, שעליהן מחקר מיקרוסופט יודע משהו. הודות להם, ניתן היה להפחית במידה ניכרת את שיעור השגיאות ולשפר את המהימנות והחוסן של זיהוי דיבור, צעד ראשון הכרחי ל-Skype Translator לעבוד.
תרגום מכונה הוא העמוד הברור השני עליו נשען מתרגם Skype. כאן מיקרוסופט שוב משתמשת בטכנולוגיה פנימית ומשתמשת במנוע התרגום של Bing כדי לתרגם טקסט משפה אחת לאחרת.המערכת שלו משתמשת בשילוב של טכניקות זיהוי תחביר ומודלים סטטיסטיים כדי לחדד את התוצאה. בנוסף, בהזדמנות זו עבר הכשרה מיוחדת של המנוע לזהות את סוג השפה המתרחשת בשיחות מדוברות, רחוק מהנכונות והניקיון המניחים בדרך כלל בכתב. לפיכך, מערכת ה-Skype Translator משלבת את בסיס ידע השפה העצום של Bing Translator יחד עם שכבה נרחבת של מילים וביטויים הנפוצים בשפה הדיבורית.
אבל דיבור ושפות הם שטח מסובך. הם משתנים כל הזמן, הם מגיעים במגוון טעמים וזנים, לכל אדם יש את הסגנון המיוחד שלו וכו'. Skype Translator חייב לעמוד בקצב של כל זה, ודורש הכשרה מתמדת ואופטימיזציה של זיהוי דיבור ותרגום מכונה כאחד. לשם כך המערכת נבנתה על פלטפורמת 'למידה מכונה' חזקה, ענף של בינה מלאכותית שמטרתה לפתח טכניקות המאפשרות למכונות ואלגוריתמים ללמוד על ידי אימון עם נתונים לדוגמה.השימוש בטכניקות אלו, הנפוצות בתחום הסטטיסטיקה, מאפשרים לשירות להשתפר תוך כדי השימוש בו, תוך ניצול הנתונים שנוצרו בעת השימוש בו כדי לחדד עוד יותר את זיהוי הדיבור והתרגום האוטומטי.
חלק מנתוני הבדיקה הללו נוצרים אוטומטית ממגוון רחב של מקורות, כולל רשתות חברתיות כמו פייסבוק, דפי אינטרנט מתורגמים, סרטונים עם כתוביות, או אפילו שיחות שנוצרו למטרה ומתועמלות ומתורגמות באופן ידני . אבל חלק אחר מהנתונים מגיע משיחות בפועל שנערכו דרך השירות. זה חשוב מכיוון שכפי שמיקרוסופט מודיעה לך בכל שיחה, עליך לדעת ש-מתרגם סקייפ יכול להקליט שיחות, לשמור אותן אנונימיות, כך שניתן יהיה לנתח אותן מאוחר יותר על ידי האלגוריתמים שלו והוצגו בתהליך ההכשרה של המודלים הסטטיסטיים שלהם.
מתרגם סקייפ יכול לעבוד כראוי רק אם הוא מסוגל ללמוד בתהליך המבוסס על השימוש בו בשיחות אנושיות אמיתיות
"המערכת לא הייתה יכולה לתפקד ללא תהליך למידה זה. בזמן שבני אדם מדברים אנחנו עוצרים וחוזרים על דברים, עושים טעויות ומשנים את החשיבה שלנו תוך כדי, הצגת ahs, ehms, uhms>רק למידה על השימוש בפועל שלו יכולה לשפר אותו "
משפת דיבור אחת לאחרת תוך כמה שניות
נתמך על ידי כל ההתקדמות הללו, המפתח הוא שמתרגם סקייפ מסוגל לבצע את כל תהליך הזיהוי והתרגום במהירות ובשקיפות עבור המשתמש בכל פעם שאנו מדברים, המערכת חייבת לזהות את מה שאנו אומרים, לתרגם אותו לשפת הנמען ולתקשר אליו באופן שנשאר נאמן למה שניסינו לתקשר בהתחלה.ככל שנבחין פחות בצעדי הביניים כך טוב יותר.
ברגע שהמערכת מזהה שאנחנו מדברים היא מתחילה להקליט את מה שאנחנו אומרים ומתחילה את תהליך זיהוי הדיבור זה לא על לא רק לזהות כל מילה שאנו מבטאים, אלא גם לבטל כל דבר מיותר, למחוק ביטויים ורעש חסרי משמעות, לזהות את חלוקת הטקסט למשפטים, עם הכללת סימני פיסוק ואותיות גדולות, ולספק לו הקשר זה עוזר לפרשנות שלך. כשחושבים על זה קצת, מבינים כמה קשה לקבוע את כל זה משפה מדוברת.
מתרגם סקייפ זקוק לזיהוי הדיבור הזה כדי להיות מדויק ככל האפשר, כי מה שאחריו הוא הכנת המידע שנאסף כדי להשוות אותו עם המודלים הסטטיסטיים שהשתפרו באמצעות מערכת 'למידת מכונה' שלה.כאן התהליך מורכב ממציאת קווי דמיון בין מה שהמערכת הבינה שאמרנו לבין המילים וההקשרים הכלולים במודלים, כדי ליישם לאחר מכן טרנספורמציות שנלמדו בעבר שימירו את האודיו לטקסט ויתרגם אותו לשפה הזרה.
בשלב האחרון, סקייפ הכינה זוג בוטים, עם קולות של נשים וגברים, שמתפקדים כמתורגמנים בשיחה לאחר בחירת אחד על ידי המשתמש, הוא יהיה אחראי על העברת המסר המתורגם שלנו למקלט, כך שלא רק התמלילים והתרגומים הכתובים יופיעו על המסך, אלא הוא גם יוכל לשמוע אותם בקול כאילו היה אדם שלישי. מתווך בינינו. . הבוטים הללו מסוגלים להעביר במהירות את ההודעה, כך שמי שמאזין בצד השני של המסך יקבל את ההודעה מספר שניות לאחר הגייתה.
תוכנית המבחן כנקודת התחלה
דווקא נוכחותם של בוטים כדוברי צד שלישי בשיחה היא אחד הפרטים שעדיין נותרו לליטוש. מיקרוסופט מכירה בכך שההסתגלות אליהם קלה לאנשים שרגילים לדבר באמצעות מתורגמן, אבל לאחרים זה דורש תקופת למידה. וזה שמיקרוסופט וסקייפ אולי נחושים ליצור את חוויית התרגום הטובה ביותר שקיימת בזמן אמת, אבל כדי לעשות זאת הם צריכים שנלמד גם את עצמנו וגם את המכונותהתצוגה המקדימה של Skype Translator היא רק עוד שלב אחד בתהליך הזה.
תוכנית המבחנים עלתה לאוויר באמצע דצמבר, והציגה תרגום מדובר בין שתי שפות: אנגלית וספרדית, ותרגום כתוב ביותר מ-40 כדי לגשת אליו יש צורך בהזמנה, אותה נוכל לבקש בהרשמה באתר התוכנית. אם אנו חפצים בכך נוכל לנסות את Skype Translator מיישומי Skype עבור Windows 8.1 או Windows 10 תצוגה מקדימה טכנית. אחרת נצטרך להמתין להארכת השירות ולפרסום רשמי.
"בכל מקרה, מתרגם סקייפ יצא לדרך בדיוק כשאנחנו עומדים להיפרד משנת 2014. לפני שתסיים, עצרו כאן לשנייה ותחשבו על השנה שקראתם זה עתה: אלפיים ארבע עשרה>"
Via | Skype Blogs I, II