Benarkah Voice Assistant Masa Depan Kita?

Kalau dulu kita menggunakan ponsel kita untuk berinteraksi dengan orang lain, kini kita bisa berinteraksi dengan ponsel kita berkat adanya voice assistant atau yang akan kami singkat VA untuk artikel ini. Berawal dari tahun 1961, IBM menciptakan perangkat voice recognition pertama yang dapat mengenali 16 kata dan digit sampai sekarang perangkat kita sudah dapat memberikan balasan dari pernyataan ataupun pertanyaan yang kita lontarkan kepadanya. Teknologi tentu sudah berkembang sangat jauh bagi voice assistant, sampai-sampai tanpa kalian sadari kita memasuki perang VA.

Jika kalian lihat semenjak 2011, tahun dimana Apple memperkenalkan kita dengan Siri, VA milik mereka yang disematkan kedalam iPhone 4S pertama kali, setiap tahunnya hingga sekarang para perusahaan teknologi terbesar telah berusaha untuk menyaingi Siri. Google mengeluarkan Google Now pada 2012, Microsoft dengan Cortana pada 2013 dan Amazon bersama Alexa yang diperkenalkannya melalui perangkat VA independen pertama – Amazon Echo pada 2014. Bahkan Samsung-pun juga mengikuti “perperangan” ini dengan meluncurkan Bixby pada Samsung Galaxy S8/S8+, Samsung menunjukkan bahwa mereka serius untuk hal ini dengan memberikan tombol khusus untuk Bixby pada perangkatnya tersebut.

List Voice Assistants

Perangkat Voice Assistant

Namun, mengapa para perusahaan teknologi terbesar ini rela untuk menghabiskan banyak aset mereka untuk VA? Apakah hanya untuk memenuhi persaingan, atau ada maksud lain dibalik itu? Yuk simak!

VOICE ASSISTANT

Human Interaction With Voice Assistant

VA adalah sebuah interface, seperti interface lainnya, VA memperbolehkan terjadinya pertukaran informasi antar 2 hal yang dalam hal ini adalah pengguna dengan komputer. Agar sebuah interface dapat dinilai bagus, interface harus memberikan cara yang efektif untuk pengguna memberikan input kepada komputer dan memberikan output kepada pengguna. Jadi, untuk menilai bagus atau tidaknya sebuah interface adalah dengan melihat hasil interaksi antar pengguna dengan komputer dan hasilnya akan selalu tergantung.

Ada 2 poin keuntungan dari VA, yaitu :

  • Mudah untuk dipahami. Berbicara ataupun diajak bicara akan terasa lebih natural bagi manusia untuk memberikan atau menerima sebuah informasi. Ya, mungkin jika dilihat dari teknologi VA sekarang, kita harus tetap menggunakan susunan kalimat yang terstruktur dan tidak biasanya untuk dapat dimengerti oleh VA, tapi secara umum VA mudah dimengerti untuk hampir semua orang.
  • Komunikasi 2 arah yang instan. Anda tidak perlu mengeluarkan perangkat kalian dan menyalakannya untuk memperoleh informasi, mulut kalian selalu siap untuk berbicara dan telinga kalian selalu siap untuk mendengar.

Jika kedua keuntungan ini digabungkan, maka VA akan lebih praktis, terutama untuk input yang pendek.

Namun, VA juga memiliki keterbatasannya, seperti :

  • Secara konteks, VA dapat dibilang seperti jalur satu arah. Informasi hanya berjalan 1 arah saja secara input maupun output. Sebagai contoh, saya pulang kerumah dan mendengarkan Google Home Mini – sebuah perangkat VA besutan Google – sedang memutarkan sebuah lagu dari Spotify. Informasi yang saya dapatkan dari Google Home Mini hanyalah lagu yang sedang diputar, saya tidak dapat mengetahui judulnya, penyanyinya atau informasi lainnya mengenai lagu tersebut. Saya harus bertanya lagi kepada Google Assistant judul lagunya dan ketika itu lagu akan terhenti untuk mendengarkan pertanyaan saya dan memberikan informasi yang saya inginkan. Sedangkan jika saya memutarnya dari komputer saya dengan spotify terbuka, saya dapat melihat semua informasinya dari judul, penyanyi, dan lainnya tanpa harus menghentikan lagu tersebut karena visual, tidak seperti voice adalah umpama sebuah jalanan dengan banyak jalur. Kita dapat melihat semua konteks yang ada pada layar komputer kita bahkan memberikan input pada komputer kita tanpa mengganggu output yang sedang diberikan oleh komputer kepada kita.
  • Tidak terlalu akurat. Pernah kalian bayangkan jika kita harus memberikan soal matematika tingkat dewa dengan begitu banyak rumus yang membuat mata kita sakit untuk melihatnya kepada perangkat VA kita ketika kita ingin mendapatkan sebuah bantuan? Ya, akan terasa seperti mimpi buruk. Namun, jika kita mengetiknya dengan keyboard akan akurat karena kita dapat menghapus dan juga melihat langsung apa yang akan kita ketik.

 

Pada akhirnya, menggunakan suara sebagai sarana komunikasi kita dengan komputer memiliki pengorbanan. Kita menukar kecepatan dan kepraktisan dengan konteks dan keakuratan. Spotify adalah contoh yang cocok untuk hal ini, jika saya hanya ingin mendengarkan sebuah lagu, maka akan sangat cepat dan praktis untuk berteriak kepada VA untuk memutarkan lagu yang kita inginkan tersebut. Namun, jika saya ingin melakukan sesuatu yang lebih kompleks, seperti menyusun sebuah playlist, maka saya akan lebih memilih untuk mengerjakannya di Laptop saya dimana terdapat User Interface yang lengkap mengenai informasi-informasinya (konteks dan akurat).

Hal ini sangat jelas jika dilihat dari perangkat-perangkat yang dikeluarkan oleh Google, Apple, Amazon dan lainnya yang hanya fokus untuk VA adalah smart speaker, dimana kepraktisan adalah inti dari perangkat tersebut.

BAGAIMANA DENGAN MASA DEPAN VA?

Untuk sekarang, saya sedikit heran dengan orang-orang yang mengatakan bahwa voice adalah masa depan kita. Mungkin akan menjadi satu interface dari banyak, tapi tidak akan menjadi satu-satunya. Sangat tidak akurat untuk melakukan perintah yang terlalu kompleks. Namun ada 2 hal yang mungkin akan menjadi trend di masa yang akan datang dan membantu voice lebih berguna.

  • Menggabungkan voice dengan visual, seperti yang dilakukan Amazon dengan Amazon Echo Show miliknya yang terdapat sebuah VA dan juga layar untuk UI-nya. Google-pun juga menyadari keterbatasan voice sebagai metode input dan bekerjasama dengan LG, JBL, Lenovo, dan Sony pada CES 2018 untuk mengeluarkan smart display (secara garis besar fungsinya sama seperti Amazon Echo Show). Namun, contoh terbaik untuk hal ini adalah VR (Virtual Reality) dan AR (Augmented Reality) dan percaya atau tidak, Cortana milik Microsoft adalah yang paling baik dalam mengeksekusinya untuk sekarang. Antara kalian menggunakan Holo Lens atau perangkat VR seperti Dell Visor, kalian bisa menyuruh Cortana untuk melakukan sesuatu bagi kalian. Salah satu keterbatasannya adalah perangkat tersebut tidak memiliki metode input yang akurat, kontroler VR mungkin cocok untuk menembak zombie tapi sulit untuk hal lainnya dan dalam kasus Holo Lens, kalian harus bergantung pada hand tracking yang tentu tidak selalu akurat. Untuk dapat memberikan input verbal dengan Cortana sangatlah berguna.
  • Ketika perangkat kita dapat mengubah task yang kompleks dengan perintah yang sederhana. Untuk sementara, hal yang muncul untuk kasus ini adalah Bixby, ya betul VA besutan Samsung yang kontroversial itu. Bixby memberikan pengguna untuk menavigasi UI Samsung yang padat karena sangat banyak fiturnya tersebut dan tidak semua orang pakai menjadi sederhana. Anda dapat langsung memberikan perintah kepada Bixby seperti “Rekam video 4K dengan 30fps” dan Bixby akan menavigasikan UI Samsung tersebut untuk melakukan perintah tersebut agar kalian tidak perlu menavigasikannya sendiri.

 

Tapi, untuk VA menjadi masa depan kita dan menggantikan interface lainnya adalah hal yang mustahil menurut kami dan lebih masuk akal jika VA bekerja bersamaan dengan interface lainnya untuk menciptakan suatu ekosistem yang lebih berguna lagi. Tapi bagaimana menurut kalian? Yuk diskusikan di kolom komentar dibawah 🙂 Kami sangat ingin mendengar feedback dari kalian dan seperti biasa, sampai jumpa di artikel Getective selanjutnya!

Recent Posts

Recent Comments

James Alexander Written by:

A simple boy with an enormous appetite for curiosity.

One Comment

Leave a Reply

Your email address will not be published. Required fields are marked *