Membangun bisnis hebat dengan kekuatan Cloud

TensorFlow menghubungkan petani mentimun dengan “deep-learning”

Diposting oleh Kazunori Sato (Pengacara Pengembang Tim Cloud Platform)

Ketika saya melihat program Google igo komputer『AlphaGo』sejalan dengan pemain igo kelas , saya pikir hal besar sedang terjadi. Hal ini merupakan kesempatan untuk mengembangkan mesin pemilihan mentimun dengan cara “deep-learning”.

Pelatihan ini hanya berjalan 4 bulan. Makoto Koike, petani yang mengembangkan produksi mentimun di wilayah Shizuoka sedang meningkatkan produktivitas mentimun dengan mesin pemilih menggunakan perpustakaan mesin pembelajaran Google “TensorFlow”, dan prototipe kedua selesai pada bulan Juli dan akan dipamerkan di "Maker Faire Tokyo 2016" yang akan diselenggarakan di “Tokyo Big Sight” pada tanggal 6-7 Agustus.

Pertama -tama, silakan lihat aktivitas kami di link : https://youtu.be/4HCE1P-m1l8


Menjadikan “Keahlian Memilih Mentimun Ibu " Menggunakan AI

Bapak Koike yang sudah berkecimpung dalam pengembangan sistem kontrol untuk produsen suku cadang mobil selama 7 tahun, mulai pensiun untuk membantu orang tuanya menanam mentimun setahun yang lalu. Ketika saya sungguh-sungguh mulai bekerja, selain menanam mentimun itu sendiri, saya perhatikan bahwa sulit untuk mengerjakan "memilah” (memetik) mentimun dan hal ini banyak menimbulkan masalah. "Bahkan jika Anda berbicara mengenai mentimun secara singkat, kualitas dan kesegarannya berbeda" (Bapak . Koike)

Pak Koike, Ladang Mentimun dan Kedua Orang Tuanya

Menurut ayah Pak Koike, nilai jual ada pada "mentimun dengan tusuk sate". Keyakinan ayah dan ibu Koike adalah mengantarkan mentimun segar dan renyah yang baru dipetik ke meja, dengan kutil permukaan yang masih tersisa. Mentimun segar yang lurus, tebal, berwarna cerah, dan memiliki kutil diklasifikasikan sebagai "sangat baik" dan memiliki harga tinggi di pasaran.


Mentimun Ladang Pak Koike dan Mentimun Komersial


Sebenarnya, tidak ada standar industri tertentu untuk kualitas mentimun ini, dan kualitas hanya ditentukan oleh masing-masing petani. Ladang Pak Koike dibagi menjadi 9 tahap, dan ibunya bertanggung jawab atas semua pekerjaan. Ketika panen, kabarnya akan memakan waktu selama 8 jam sehari untuk melakukan penyortiran. Mesin sortasi skala besar juga tersedia secara komersial, tetapi terbatas dalam kemampuan dan biaya penyortiran, dan tidak sering digunakan oleh petani secara perorangan.



"Penyortiran mentimun bukanlah tugas yang bisa dilakukan siapa saja dengan segera. Tidak hanya panjang dan ketebalan mentimun, tetapi juga tekstur seperti warna, gloss, ketidakrataan atau goresan, apakah bentuknya terdistorsi, kutil tetap ada dan lain sebagainya. Butuh waktu berbulan-bulan untuk memahaminya, dan sulit untuk bertanya ke pekerja tentang hal ini selama waktu sibuk, tetapi akhirnya saya bisa memilih dengan baik juga. Bahkan ketika menyortir dengan mesin pun, pengenalan gambar sederhana yang hanya melihat panjang dan bentuk saja tidak cukup”.


Namun, Pak Koike berpendapat bahwa pekerjaan penyortiran seperti itu bukanlah pekerjaan murni seorang petani. "Petani ingin meluangkan waktu membuat sayuran yang lezat. Untuk melanjutkan pekerjaan budidaya mentimun, mereka pada akhirnya ingin mengotomatiskan pekerjaan penyortiran ".

Bagaimana Anda membuat mesin mengingat keterampilan penyortiran ibu Anda? Maka dengan bantuan berita AlphaGo, Pak Koike mulai mencoba memilah mentimun dengan deep-learning menggunakan TensorFlow, perpustakaan pembelajaran mesin sumber terbuka yang dirilis oleh Google. Kemudian, saya mulai menyortir mentimun dengan deep learning, menggunakan TensorFlow, perpustakaan pembelajaran mesin sumber terbuka yang dirilis oleh Google.


Deep Learning dengan menggunakan TensorFlow untuk Pertama Kalinya


Kelebihan pengenalan gambar dengan “deep-learning” adalah bahwa komputer mempelajari "fitur" untuk dipahami untuk mengidentifikasi gambar dengan struktur hierarkis yang dibentuk oleh sejumlah besar neuron (Untuk detail tentang “deep-learning”, lihatlah artikel “See Neural Networks” di TensorFlow Playground). Sebagai hasilnya, memungkinan untuk mewujudkan pengenalan gambar dengan kinerja yang melebihi mata manusia tergantung pada aplikasinya, dan juga memungkinkan untuk memperkirakan, misalnya, jenis kucing, model mobil, dan model pesawat. Oleh karena itu, Pak Koike berpikir bagaimana jika "deep learning" digunakan untuk memilih mentimun.

"Ketika TensorFlow dirilis bersamaan dengan berita AlphaGo, kita ingin mencoba dengan gambar mentimun. Ini adalah pertama kalinya menyentuh pembelajaran mesin dan “deep-learning”, tetapi setelah mencoba tutorial TensorFlow, lebih dari yang diharapkan Jujur saya terkejut bahwa hasilnya segera didapat, dan saya merasa itu bisa digunakan. "


Dengan menggunakan TensorFlow, pustaka sumber terbuka, Anda dapat menggunakan sampel dan tutorial yang diterbitkan bahkan jika Anda tidak terbiasa dengan model matematika dan algoritma optimasi yang diperlukan untuk menerapkan pembelajaran yang mendalam, Anda tetap bisa untuk "mulai menyentuh". Rintangan untuk "mencoba" deep learning telah menjadi jauh lebih rendah, membuatnya lebih mudah bagi para profesional pembelajaran non-mesin untuk mencoba.

Gambar di bawah ini menunjukkan konfigurasi sistem Unit 2 untuk penyortiran mentimun oleh Bapak Koike. Pengambilan gambar dengan webcam dikendalikan oleh Raspberry Pi 3 di mana jaringan saraf kecil dengan TensorFlow menentukan ada atau tidaknya mentimun. Gambar mentimun yang diambil dikirim ke mesin pengenalan pembelajaran pada TensorFlow pada mesin Linux.


Untuk pengenalan gambar mentimun, jaringan saraf dalam yang sedikit dimodifikasi digunakan berdasarkan kode sampel TensorFlow "Deep MNIST for Experts". Setelah melewati beberapa kali melalui lapisan konvolusi dan lapisan penggabungan, resolusi dan nomor klasifikasi gambar yang akan ditangani diubah untuk penyortiran mentimun, dengan konfigurasi mengatur semua lapisan bersama.


Pengidentifikasian "wart" pada Google Cloud dengan AI

Salah satu masalah pengenalan gambar dalam pembelajaran mendalam adalah bahwa sejumlah besar gambar pembelajaran diperlukan. Sekitar 7.000 gambar mentimun diambil oleh Mr. Koike saat mengembangkan unit prototipe No. 2. Saya mengambil gambar di sebelah ibu saya saat pemilahan mentimun dan membutuhkan waktu sekitar dua atau tiga bulan untuk menyiapkan gambar pembelajaran. Namun, Koike mengatakan bahwa masih ada gambar yang kurang memadai untuk belajar.


"Jika Anda memverifikasi dengan gambar uji yang disiapkan bersama-sama dengan gambar belajar, tingkat akurasi mencapai 95%. Namun, jika Anda mencobanya dengan gambar mentimun yang baru dibuat, tingkat akurasi turun menjadi sekitar 70%. Tampaknya "over-learning" ( sebuah fenomena di mana pembelajaran bias terhadap sejumlah kecil data pembelajaran) terjadi karena jumlah gambar kecil.


Tantangan lain dari “ deep-learning” adalah kekuatan komputasi. Konfigurasi sistem Bapak Koike saat ini adalah dengan belajar menggunakan CPU dari PC desktop Windows biasa. Gambar mentimun dikonversi ke resolusi rendah 80 x 80 piksel, tetapi masih membutuhkan waktu 2-3 hari untuk menyelesaikan pembelajaran dengan 7000 lembar foto.

「Bahkan dengan resolusi ini, dimungkinkan untuk menyortir dengan mengenali tingkat kelengkungan , panjang, dan ketebalan mentimun. Di sisi lain, tidak mungkin mengenali kondisi terperinci seperti kehalusan permukaan, kutil , warna atau goresan. Saya pikir tingkat akurasi dapat ditingkatkan jika resolusi ditingkatkan lebih lanjut dan di close-up. Namun, kami tidak dapat mencoba semuanya karena waktu belajar akan meningkat dengan cepat”」.


Untuk mengatasi masalah “deep learning” dengan mengonsumsi sejumlah besar daya komputasi, perusahaan besar telah memperkenalkan server GPU mahal yang memiliki kinerja satu digit lebih tinggi daripada CPU umum pada skala beberapa hingga beberapa puluh, dan pembelajaran yang didistribusikan.Dalam beberapa kasus, suatu lingkungan sedang dibangun. Secara alami, itu membutuhkan banyak uang dan tidak semua orang dapat dengan mudah mencobanya.

Oleh karena itu, Google berencana untuk merilis "Cloud Machine Learning (Cloud ML)," layanan yang menawarkan pembelajaran dengan biaya rendah dengan puluhan hingga ratusan CPU dan GPU di Cloud, dalam waktu dekat. Dengan Cloud ML, yang perlu Anda lakukan adalah mengatur dan mengoperasikan server GPU yang diperlukan untuk pembelajaran terdistribusi skala besar dengan TensorFlow, seperti menyiapkan lingkungan terdistribusi, dan Anda menyerahkan segalanya ke Google, dan hanya perlu membayar biaya untuk belajar. Diharapkan menjadi layanan yang dapat dengan mudah menguji kekuatan “ deep learning”.


Server khusus “deep learning” dari Google yang digunakan untuk permainan AlphaGo


Cloud ML mengutarakan bahwa ingin menjawab Bapak Koike sesegera mungkin. "Jika Anda dapat menggunakan Cloud ML, Anda dapat mencoba mempelajari lebih banyak gambar mentimun dengan resolusi lebih tinggi. Berbagai percobaan dan kesalahan dapat dilakukan, seperti meningkatkan jumlah tahapan jaringan saraf . Saya tidak sabar menunggu dari sekarang”.

Bisakah AI meneruskan keterampilan menyortir ibunda Pak Koike? Gagasan Bapak Koike tentang "memilah mentimun dengan deep learning " menjadi kenyataan dalam waktu yang sangat singkat dan dengan biaya rendah, dipicu oleh TensorFlow dan Google Cloud. Apa yang paling menarik dari “AI” saat ini? Jawabannya mungkin lahir dari "Saya sudah mencoba" di situs-situs terdekat kita.


This is a translation of an article published by Cloud Ace, Inc.

Available online: https://cloudplatform-jp.googleblog.com/2016/08/tensorflow_5.html