Mengapa Google percaya pembelajaran mesin adalah masa depannya

Salah satu demo yang paling menarik pada keynote Google I / O minggu ini menampilkan versi baru pembantu suara Google yang akan dikeluarkan akhir tahun ini. Seorang pekerja Google meminta Pembantu Google untuk membentangkan fotonya dan kemudian menunjukkan gambarnya dengan haiwan. Dia mengetuk satu dan berkata, "Hantar kepada Justin." Foto itu dijatuhkan ke aplikasi pemesejan.

Dari sana, perkara menjadi lebih menarik.

"Hei Google, hantar e-mel ke Jessica," katanya. "Hi Jessica, saya baru pulang dari Yellowstone dan jatuh cinta dengannya." Telefon itu menyalin kata-katanya, meletakkan "Hi Jessica" pada barisnya sendiri.

"Tetapkan tertakluk kepada pengembaraan Yellowstone," katanya. Pembantu difahami bahawa ia harus meletakkan "pengembaraan Yellowstone" ke dalam subjek, bukan badan mesej.

Kemudian tanpa perintah yang jelas, wanita itu kembali kepada mendiktekan badan mesej itu. Akhirnya dia berkata "hantar," dan pembantu Google itu.

Google juga berusaha untuk mengembangkan pemahaman pembantu mengenai rujukan peribadi, kata syarikat itu. Sekiranya pengguna berkata, "Hei Google, apa cuaca seperti di rumah Ibu," Google akan dapat mengetahui bahawa "rumah ibu" merujuk kepada rumah ibu pengguna, mencari alamatnya, dan menyediakan ramalan cuaca untuk bandarnya.

Google mengatakan bahawa pembantu generasi akan datang datang kepada "telefon Pixel baru" -kalau itu, telefon yang datang selepas baris Pixel 3 semasa-lewat tahun ini.

Jelas, ada perbezaan besar antara demo kalengan dan produk penghantaran. Kita perlu menunggu dan melihat sama ada interaksi biasa dengan pembantu baru ini berfungsi dengan baik. Tetapi Google seolah-olah membuat kemajuan mantap ke arah impian membina pembantu maya yang dapat mengendalikan tugas-tugas yang kompleks dengan suara dengan cekap.

Banyak pengumuman di I / O seperti ini: bukan pengumuman produk baru utama, tetapi penggunaan teknik pembelajaran mesin untuk secara beransur-ansur membuat pelbagai produk Google lebih canggih dan bermanfaat. Google juga telah membuat beberapa penambahbaikan di dalam perisian pembelajaran komputernya, yang membolehkan kedua-dua perisian Google dan perisian pihak ketiga menggunakan teknik pembelajaran mesin yang lebih canggih.

Khususnya, Google sedang membuat dorongan besar untuk mengalihkan operasi pembelajaran mesin dari awan ke peranti mudah alih orang-orang. Ini sepatutnya membolehkan aplikasi berkuasa ML lebih pantas, lebih peribadi, dan mampu beroperasi secara luaran.

Google telah membawa caj pada pembelajaran mesin

Sekiranya anda bertanya kepada pakar pembelajaran mesin ketika ledakan pembelajaran mendalam bermula, ramai akan menunjuk pada kertas kerja 2012 yang dikenali sebagai "AlexNet" selepas penulis utama Alex Krizhevsky. Penulis, trio penyelidik dari University of Toronto, memasuki pertandingan ImageNet untuk mengklasifikasikan imej menjadi salah satu dari seribu kategori.

Penganjur ImageNet membekalkan lebih daripada sejuta contoh imej berlabel untuk melatih rangkaian. AlexNet mencapai ketepatan yang belum pernah terjadi sebelumnya dengan menggunakan rangkaian neural yang mendalam, dengan lapan lapisan boleh dilatih dan 650,000 neuron. Mereka dapat melatih rangkaian besar pada begitu banyak data kerana mereka mengetahui cara memanfaatkan GPU gred pengguna, yang dirancang untuk pemprosesan selari berskala besar.

AlexNet memperlihatkan pentingnya apa yang anda sebut sebagai najis tiga kaki dalam pembelajaran: algoritma yang lebih baik, lebih banyak data latihan, dan lebih banyak kuasa pengkomputeran. Sepanjang tujuh tahun yang lalu, syarikat-syarikat telah berebut untuk memperkuat keupayaan mereka dalam ketiga-tiga bidang, menghasilkan prestasi yang lebih baik dan lebih baik.

Google telah mengetuai caj ini hampir dari awal. Dua tahun selepas AlexNet memenangi pertandingan pengiktirafan imej yang dikenali sebagai ImageNet pada tahun 2012, Google memasuki pertandingan dengan rangkaian saraf yang lebih dalam dan mengambil hadiah utama. Syarikat itu telah mengupah puluhan pakar pembelajaran mesin peringkat atas, termasuk pengambilalihan DeepMind permulaan pembelajaran dalam tahun 2014, menjaga syarikat di barisan depan reka bentuk rangkaian neural.

Syarikat itu juga mempunyai akses tanpa had ke set data yang besar. Makalah 2013 menggambarkan bagaimana Google menggunakan rangkaian saraf yang mendalam untuk mengiktiraf nombor alamat dalam berpuluh-puluh juta imej yang ditangkap oleh Google Street View.

Google telah bekerja keras di hadapan perkakasan. Pada tahun 2016, Google mengumumkan bahawa ia telah mencipta cip tersuai yang dipanggil Unit Pemprosesan Tensor yang direka khusus untuk mempercepatkan operasi yang digunakan oleh rangkaian saraf.

"Walaupun Google dianggap membina sebuah Litar Bersepadu Khusus Aplikasi (ASIC) untuk rangkaian saraf seawal tahun 2006, keadaan menjadi sangat mendesak pada tahun 2013," kata Google pada tahun 2017. "Ketika itulah kita menyadari bahawa permintaan komputasi yang cepat berkembang dari rangkaian saraf boleh menghendaki kami menggandakan bilangan pusat data yang kami beroperasi. "

Inilah sebabnya mengapa Google I / O mempunyai tumpuan sedemikian pada pembelajaran mesin selama tiga tahun yang lalu. Syarikat itu percaya bahawa aset-tentera kecil pakar-pakar pembelajaran mesin, jumlah data yang besar, dan silikon tersuai sendiri-menjadikannya ideal untuk mengeksploitasi peluang-peluang yang dibentangkan oleh pembelajaran mesin.

Google I / O tahun ini sebenarnya tidak mempunyai banyak pengumuman produk yang berkaitan dengan ML baru kerana syarikat itu telah memasak pembelajaran mesin ke banyak produk utamanya. Android mempunyai pengiktirafan suara dan Pembantu Google selama bertahun-tahun. Foto Google telah lama mempunyai fungsi carian berasaskan ML yang mengagumkan. Tahun lepas, Google memperkenalkan Google Duplex, yang membuat tempahan bagi pihak pengguna dengan suara manusia realistik yang tidak nyata yang dihasilkan oleh perisian.

Sebaliknya, pembentangan I / O mengenai pembelajaran mesin memberi tumpuan kepada dua bidang: memindahkan lebih banyak aktiviti pembelajaran mesin ke telefon pintar dan menggunakan pembelajaran mesin untuk membantu orang kurang bernasib baik-termasuk orang yang pekak, buta huruf, atau menderita kanser.

Memerintahkan mesin belajar ke telefon pintar

Usaha lepas untuk membuat rangkaian saraf lebih akurat telah melibatkan menjadikannya lebih mendalam dan lebih rumit. Pendekatan ini menghasilkan keputusan yang mengagumkan, tetapi ia mempunyai kelemahan yang besar: rangkaian sering menjadi terlalu rumit untuk dijalankan pada telefon pintar.

Orang ramai kebanyakannya menguruskannya dengan mengimbangi pengiraan kepada awan. Versi awal Google dan pembantu suara Apple akan merakam audio dan memuat naiknya ke pelayan syarikat untuk diproses. Itu berfungsi dengan baik, tetapi ia mempunyai tiga kelemahan penting: ia mempunyai latensi yang lebih tinggi, ia mempunyai perlindungan privasi yang lemah, dan ciri ini hanya akan berfungsi secara dalam talian.

Jadi, Google telah berusaha untuk mengalihkan lebih banyak pengiraan pada peranti. Peranti Android semasa sudah mempunyai keupayaan pengenalan suara asas pada peranti, tetapi pembantu maya Google memerlukan sambungan Internet. Google mengatakan bahawa keadaan akan berubah pada akhir tahun ini dengan mod luar talian yang baru untuk Pembantu Google.

Keupayaan baru ini merupakan sebab utama bagi masa tindak balas kilat yang ditunjukkan oleh demo minggu ini. Google mengatakan pembantu akan "sehingga 10 kali lebih cepat" untuk tugas tertentu.

Tonton video itu: Google Keynote Google IO'19 (Disember 2019).