Algoritma sumber terbuka Microsoft yang memberikan Bing beberapa pintunya

Enjin carian hari ini lebih daripada sekadar pencocokan kata kunci bodoh yang mereka gunakan. Anda boleh bertanya-soalan, "Berapa tinggi menara di Paris?" - dan mereka akan memberitahu anda bahawa Menara Eiffel adalah 324 meter (1,063 kaki) tinggi, kira-kira sama dengan bangunan 81 tingkat. Mereka boleh melakukan ini walaupun soalan itu sebenarnya tidak menamakan menara itu.

Bagaimana mereka melakukan ini? Seperti halnya pada hari ini, mereka menggunakan pembelajaran mesin. Algoritma mesin pembelajaran digunakan untuk membina vektor - pada dasarnya, senarai panjang nombor-dalam arti yang mewakili data input mereka, sama ada teks pada halaman web, imej, bunyi, atau video. Bing menangkap berbilion vektor ini untuk semua jenis media yang ia indeks. Untuk mencari vektor, Microsoft menggunakan algoritma yang memanggil SPTAG ("Pokok dan Graf Pemisahan Ruang"). Pertanyaan input ditukar menjadi vektor, dan SPTAG digunakan untuk mencari "jiran terdekat terdekat" (ANN) dengan cepat, iaitu vektor yang sama dengan input.

Ini (dengan beberapa tangan melambai tangan) adalah bagaimana soalan Menara Eiffel boleh dijawab: carian untuk "Seberapa tinggi menara di Paris?" akan menjadi "berhampiran" halaman bercakap tentang menara, Paris, dan bagaimana perkara yang tinggi. Laman-laman tersebut hampir pasti akan menjadi tentang Menara Eiffel.

Microsoft telah mengeluarkan hari ini algoritma SPTAG sebagai sumber terbuka berlesen MIT pada GitHub. Kod ini terbukti dan gred pengeluaran digunakan untuk menjawab soalan di Bing. Pemaju boleh menggunakan algoritma ini untuk mencari set vektor mereka sendiri dan melakukannya dengan cepat: mesin tunggal boleh mengendalikan 250 juta vektor dan menjawab 1,000 pertanyaan sesaat. Terdapat beberapa contoh dan penjelasan dalam AI Lab Microsoft, dan Azure akan mempunyai perkhidmatan menggunakan algoritma yang sama.

Ketua Pegawai Eksekutif Microsoft, Satya Nadella telah bercakap beberapa kali mengenai hasratnya untuk "Memokokremasi AI" dan menjadikannya tersedia untuk semua orang, mewujudkan bukan hanya alat terpusat, khusus yang memerlukan kepakaran yang cukup tetapi sesuatu yang pelbagai pemaju, menyelesaikan pelbagai pelbagai masalah, boleh digunakan sebagai sebahagian daripada toolkit mereka. Pelepasan SPTAG adalah contoh bagaimana Microsoft memasukkan kata-kata tersebut ke dalam amalan; gabungan perkhidmatan dan sumber terbuka Azure bermakna pemaju boleh memulakan perkhidmatan yang lebih terkawal dan mudah digunakan, dan kerana kepakaran atau keperluan mereka berkembang dengan lebih kompleks, mereka boleh menggunakan SPTAG untuk membina perkhidmatan mereka sendiri.

Tonton video itu: Yochai Benkler: Open-source economics (Disember 2019).