#20220312 T&I





PROJE KODU20220312
PROJE SAHİBİCantürk Tezer
PROJE MALİYETİ-
PROJE ÜNİVERSİTESİİzmir Ekonomi Üniversitesi
PROJE KATEGORİSİAkademik ve Diğer Bilişim Uygulamaları 
PROJE DANIŞMANIİlker Korkmaz



T&I'ın temel amacı, çok katılımcılı konferanslar için anında speech to speech/ speech to text/ text to text çeviri sağlamaktır. Çeviri sırasında konuşulan dili olabildiğince değişmeden tutmak için nelere dikkat edilmesi gerektiği araştırılmıştır. 5 dilin sağlanmaktadır. Bunlar Türkçe, ingilizce, ispanyolca, Almanca ve italyanca'dır. Sağlanan iletişimin unicast, multicast yayın türlerinde olması amaçlanmıştır. Backend için kullanılan ana dil JavaScript'dir. Javascript için sunduğu kolaylık nedeniyle, projenin ana dil desteği Google Hizmetleri tarafından sağlanmaktadır. Tercüme edilen dilin akıcılığının yanı sıra, kullanıcı arayüzü kolaylığı sağlamak da ana hedeflerden biridir.

Çoğu yazılım projesinde olduğu gibi bu projenin de temel motivasyonu insanların hayatını kolaylaştırmaktır. Daha spesifik olarak, proje esas olarak çeviriye odaklanmaktadır. Dünyada 208 ülke var, ancak varsayımlara göre yedi binden fazla farklı dil konuşuluyor. Dolayısıyla, bu küreselleşmiş dünyada, yalnızca bir dil kullanarak iletişim kurmak mümkün değildir. Dünyada herkes birden fazla dili çok iyi konuşsa bile iletişimde zorluklar yaşanabilir. Ülkelerin nüfusuna, teknolojik gelişmelere ve araştırmalara göre en çok konuşulan diller sürekli bir değişim halindedir. Bu, yalnızca en çok konuşulan dilleri öğrenerek çok dilli bir konferansta iletişimin sürekliliğini engeller. Teknoloji ile internet üzerinden iletişim kurmak çok kolay olsa da, farklı diller arasında yüz yüze iletişimi çok daha kolay hale getirmek projemizin amacıdır. Proje, çok dilli konferanslar için tek noktaya yayın, çok noktaya yayın ve yayın iletişim türlerini sağlamalıdır. Bu projenin temel amacı, kullanıcılara anında çeviri sağlamaktır.

Projemize benzer çalışmalar olsa da, biz bu benzer çalışmalardan spesifik olarak odaklandığımız kullanım alanı ve bu alan için yaptığımız özel çalışmalarla yenilikçi yönümüzü ortaya koyuyoruz. T&I birden fazla dilin konuşulduğu profesyonel konferanslarda kullanılması amacıyla geliştirilmektedir. Profesyonel toplantılarda çevirilen her bir kelimenin önemini biliyoruz. Bu yüzden hem sesli hem de yazılı çeviriyi aynı anda görebilme olanağı, yanlış anlaşılmaları minimalize etmek için geliştirilmektedir.

Projenin yapılabilirliği ve uygulanabilirliği oldukça yüksektir. Günümüz teknolojilerinden en yaygın kullanım alanına sahip olan Bulut teknolojisine dayalı bir proje geliştirmekteyiz.

Google Cloud. (2008, April). Cloud Computing Services —. https://cloud.google.com/

-

Projemiz dil ve konuşma üzerinde kolaylaştırıcı etkileri olan bir projedir. Her toplumda iletişim en önemli yapı taşlarındandır. Özellikle globalleşen dünyamızda yabancı diller arası iletişimi kolaylaştıran projemiz çok yaygın kullanım alanı olan bir soruna çözüm sunmaktadır.

Wordly[1]: Wordly web ve uygulama tabanlı bir spect to text uygulamasıdır. Çeviri dil desteği olarak Google destekli AMPLEXOR ve welocalize kullanılmaktadır. [1]Wordly Simultaneous Interpretation With AI. (2017). Wordly. https://www.wordly.ai/ Microsoft Translator[2]: Microsoft Translator, Microsoft tarafından sağlanan speech to speech, speech to text çeviri sağlayan bir uygulamadır. Azure teknolojilerinden yararlanılmaktadır. [2] Microsoft Corporation. (2009, June 3).Microsoft Translator. Microsoft Translator for Consumers. https://www.microsoft.com/en-us/translator/ IBM Mastor: Yuqing Gao ve diğerleri [3], az çalışılmış, kaynak verimsiz diller için bir çeviri sistemidir. Bu proje için iki ana teknoloji bileşeni çeviri yöntemi vardır NLU/NLG'dir (doğal dil anlama(NLU) ve doğal dil oluşturma (NLG)). [3]:Gao, Y., Zhou, B., Sarikaya, R., Kuo, H.-, Rosti, A.-V. I., Afify, M., & Zhu, W. (2006). IBM MASTOR: MULTILINGUAL AUTOMATIC SPEECH-TO-SPEECH TRANSLATOR. Speech-to-Speech Translator, 1–4. Takatomo Kano et al. [4] projesi, birleştirilmiş konuşma tanıma (ASR), makine çevirisi (MT) ve metinden konuşmaya (TTS) yöntemlerini kullanarak bir dilden diğerine konuşmadan konuşmaya çeviri sağlar. Uçtan uca konuşmadan konuşmaya çeviri mimarisinin modeli bizimkine benzer. [4] Kano, T., Sakti, S., & Nakamura, S. (2021). TRANSFORMER- BASED DIRECT SPEECH-TO-SPEECH TRANSLATION WITH TRANSCODER. Speech-to-Speech, 1–8. Makine çevirisi ve konuşma sentezinin konuşmadan konuşmaya çeviri sistemleri üzerindeki etkileri Simon King ve ark.[5]'da incelenmiştir. Araştırma. Proje, sözlü diyalog sistemlerinin en temel unsurlarından birinin sentetik konuşmanın kalitesi olduğunu iddia ediyor. Bunun için önerdikleri en önemli yöntem ağırlıklı sonlu durum dönüştürücülerdir (WFST'ler). [5]: Hashimoto, K., Yamagishi, J., Byrne, W., King, S., & Tokuda, K. (2011). AN ANALYSIS OF MACHINE TRANSLATION AND SPEECH SYN- THESIS IN SPEECH-TO-SPEECH TRANSLATION SYSTEM. Speech- to-Speech, 1–4.