Machine learning คือ


SUBMITTED BY: Guest

DATE: Feb. 4, 2019, 2:49 a.m.

FORMAT: Text only

SIZE: 10.4 kB

HITS: 327

  1. Machine learning คือ
  2. => http://congosaplau.nnmcloud.ru/d?s=YToyOntzOjc6InJlZmVyZXIiO3M6MjE6Imh0dHA6Ly9iaXRiaW4uaXQyX2RsLyI7czozOiJrZXkiO3M6MjY6Ik1hY2hpbmUgbGVhcm5pbmcg4LiE4Li34LitIjt9
  3. Regularization เมื่อเราทำการ extract feature ออกมาได้แล้ว จากนั้นเราต้องพิจารณาว่า อะไรคือสิ่งที่สำคัญต่อปัญหา อะไรคือสิ่งที่ไม่สำคัญ เช่น noise แต่บางครั้ง noise ก็มีความสำคัญนะ เป้าหมายของ Regularization คือ จัดการกับความซับซ้อนของ model นั่นคือ ลดข้อมูลที่ไม่จำเป็นออกไป เพื่อทำให้ได้ model ที่เรียบง่าย 3. เป็นคำถามที่น่าสนใจมาก ๆ ผมเชื่อว่า แต่ละคนย่อมให้ความหมาย และ คำจำกัดความแตกต่างกันไป ตามประสบการณ์ที่พบเจอมา ผมไปอ่านเจอบทความเรื่อง อธิบายได้ดี และ น่าสนใจ จึงนำเอาแปล และ สรุปได้ดังนี้ Machine Learning คืออะไรล่ะ? Machine Learning หรือการเรียนรู้ด้วยเครื่อง เป็นศาสตร์ที่ได้รับความสนใจมากในปัจจุบัน เมื่อพูดคุยเกี่ยวกับ Big Data หนึ่งคำถามที่พบบ่อยจะเริ่มที่ Machine Learning คืออะไร มีข้อดีหรือข้อเสียต่างจากกระบวนวิธีการวิเคราะห์ข้อมูลที่เราทำอยู่แล้วอย่างไร และทำไมจึงมีคำเฉพาะ terminology ต่างๆ มากมายเกี่ยวกับการวิเคราะห์ข้อมูลเช่น Data Science วิทยาศาสตร์ข้อมูล และ Data Mining การทำเหมืองข้อมูล แต่ละคำมีความหมายเหมือนหรือต่างกันอย่างไร ศาสตร์ของการวิเคราะห์และหาความหมายจากข้อมูลนั้นเป็นศาสตร์ที่เก่าแก่และมีการพัฒนาเริ่มมาจากวิชาคณิตศาสตร์และสถิติ แต่ในระยะหลังในยุคของ Big Data ที่มีข้อมูลจำนวนมาก มีความหลากหลายในโครงสร้าง และเป็นข้อมูลที่หลั่งไหลเข้ามารวดเร็ว ทำให้ศาสตร์และเทคโนโลยีของการวิเคราะห์ข้อมูลถูกพัฒนาให้ดีขึ้นเรื่อยๆ ในช่วงยุค 1990s คำว่า Data Mining เริ่มเป็นที่นิยม พร้อมๆกับเทคโนโลยีฐานข้อมูลที่พัฒนามากขึ้น บริษัทต่างๆได้สร้างฐานข้อมูลกลางที่เป็นตัวจัดการองค์ความรู้ในองค์กรและเริ่มทำการวิเคราะห์ข้อมูลอย่างง่าย เช่นการดึงเอาตัวเลขในฐานข้อมูลกลางมาแสดงเพื่อวัดผลและติดตามศักยภาพขององค์กรด้วยดัชนีต่างๆ business intelligence เช่นยอดขาย ศักยภาพของแรงงาน การเติบโตขององค์กร เป็นต้น เนื่องจากเทคโนโลยีฐานข้อมูลในยุคนั้นมีลักษณะเป็นตาราง relational database การทำ Data Mining จึงมักจะจำกัดแค่การสร้างโมเดลทางสถิติง่ายเช่นการสร้างสมการเชิงเส้น regression และการวิเคราะห์ขั้นสูงยังใช้ประสบการณ์ของคนเป็นกลยุทธ์หลัก ความก้าวหน้าของการวิจัยและพัฒนาสาขาคณิตศาสตร์และสถิติ ทำให้เกิดวิธีการวิเคราะห์ข้อมูลใหม่ๆ ในช่วงหลังปี 2000 คำว่า Machine Learning เริ่มเป็นที่นิยมและมีคำจำกัดความที่ชัดเจนขึ้น Machine Learning เป็นศาสตร์แขนงหนึ่งของวิทยาศาสตร์คอมพิวเตอร์?
  4. เป็นคำถามที่น่าสนใจมาก ๆ ผมเชื่อว่า แต่ละคนย่อมให้ความหมาย และ คำจำกัดความแตกต่างกันไป ตามประสบการณ์ที่พบเจอมา ผมไปอ่านเจอบทความเรื่อง อธิบายได้ดี และ น่าสนใจ จึงนำเอาแปล และ สรุปได้ดังนี้ Machine Learning คืออะไรล่ะ? Feature Extraction เป็นกระบวนการแปลงข้อมูลให้อยู่ในรูปแบบ ที่สามารถนำไปใช้งานได้ใน Machine Learning เช่นแปลงจากข้อมูล text และ image ไปอยู่ในรูปแบบชุดของตัวเลข วิธีการนี้จะช่วยลดขนาดข้อมูลที่ต้องประมวลผลลงไปอีกด้วย ซึ่งนั่นคือ การลด resource ที่ต้องใช้การประมวลผล เป็นสิ่งสำคัญมาก ๆ ในโลกของ Big Data 2. เป็นคำถามที่น่าสนใจมาก ๆ ผมเชื่อว่า แต่ละคนย่อมให้ความหมาย และ คำจำกัดความแตกต่างกันไป ตามประสบการณ์ที่พบเจอมา ผมไปอ่านเจอบทความเรื่อง อธิบายได้ดี และ น่าสนใจ จึงนำเอาแปล และ สรุปได้ดังนี้ Machine Learning คืออะไรล่ะ? Overfitting เป็นอีกหนึ่งปัญหาพื้นฐานที่พบบ่อยมากในการพัฒนาอัลกอรึทิ่ม Machine Learning ทำให้เกิดเหตุการณ์ที่ โมเดลทำงาน เช่น ทำนายข้อมูล ได้ดีมากกับ training data in-sample data แต่เมื่อไหร่ก็ตามที่เรานำโมเดลนั้นมาทำงานกัน testing data out-sample data ซึ่งเป็นข้อมูลที่โมเดลไม่เคยเห็นมาก่อน โมเดลกลับทำงานแต่แย่มาก … … Overfitting เกิดจากอะไร?
  5. Machine Learning หรือการเรียนรู้ด้วยเครื่อง เป็นศาสตร์ที่ได้รับความสนใจมากในปัจจุบัน เมื่อพูดคุยเกี่ยวกับ Big Data หนึ่งคำถามที่พบบ่อยจะเริ่มที่ Machine Learning คืออะไร มีข้อดีหรือข้อเสียต่างจากกระบวนวิธีการวิเคราะห์ข้อมูลที่เราทำอยู่แล้วอย่างไร และทำไมจึงมีคำเฉพาะ terminology ต่างๆ มากมายเกี่ยวกับการวิเคราะห์ข้อมูลเช่น Data Science วิทยาศาสตร์ข้อมูล และ Data Mining การทำเหมืองข้อมูล แต่ละคำมีความหมายเหมือนหรือต่างกันอย่างไร ศาสตร์ของการวิเคราะห์และหาความหมายจากข้อมูลนั้นเป็นศาสตร์ที่เก่าแก่และมีการพัฒนาเริ่มมาจากวิชาคณิตศาสตร์และสถิติ แต่ในระยะหลังในยุคของ Big Data ที่มีข้อมูลจำนวนมาก มีความหลากหลายในโครงสร้าง และเป็นข้อมูลที่หลั่งไหลเข้ามารวดเร็ว ทำให้ศาสตร์และเทคโนโลยีของการวิเคราะห์ข้อมูลถูกพัฒนาให้ดีขึ้นเรื่อยๆ ในช่วงยุค 1990s คำว่า Data Mining เริ่มเป็นที่นิยม พร้อมๆกับเทคโนโลยีฐานข้อมูลที่พัฒนามากขึ้น บริษัทต่างๆได้สร้างฐานข้อมูลกลางที่เป็นตัวจัดการองค์ความรู้ในองค์กรและเริ่มทำการวิเคราะห์ข้อมูลอย่างง่าย เช่นการดึงเอาตัวเลขในฐานข้อมูลกลางมาแสดงเพื่อวัดผลและติดตามศักยภาพขององค์กรด้วยดัชนีต่างๆ business intelligence เช่นยอดขาย ศักยภาพของแรงงาน การเติบโตขององค์กร เป็นต้น เนื่องจากเทคโนโลยีฐานข้อมูลในยุคนั้นมีลักษณะเป็นตาราง relational database การทำ Data Mining จึงมักจะจำกัดแค่การสร้างโมเดลทางสถิติง่ายเช่นการสร้างสมการเชิงเส้น regression และการวิเคราะห์ขั้นสูงยังใช้ประสบการณ์ของคนเป็นกลยุทธ์หลัก ความก้าวหน้าของการวิจัยและพัฒนาสาขาคณิตศาสตร์และสถิติ ทำให้เกิดวิธีการวิเคราะห์ข้อมูลใหม่ๆ ในช่วงหลังปี 2000 คำว่า Machine Learning เริ่มเป็นที่นิยมและมีคำจำกัดความที่ชัดเจนขึ้น Machine Learning เป็นศาสตร์แขนงหนึ่งของวิทยาศาสตร์คอมพิวเตอร์? นั่นแสดงว่า ต้องทำการทดสอบ model นั่นเอง ด้วยข้อมูลที่ไม่ได้นำมาสร้าง model และข้อมูลนอกช่วงเวลา จะเห็นได้ว่า Model นั้นคือสิ่งที่สำคัญมาก ๆ สำหรับการแก้ไขปัญหา ด้วย Machine Learning แต่สิ่งที่สำคัญกว่า คือ การตั้งคำถาม และ กำหนดปัญหาที่ถูกต้อง ไม่เช่นนั้น ต่อให้ใช้วิธีการ และ algorithm จนได้ model ที่ดีเพียงใดก็ไร้ค่า ถ้าสร้างมาจาก คำถาม และ ปัญหาที่ผิด สุดท้ายแล้ว คุณคิดว่า Machine Learning คืออะไร? อะไรก็ตามที่ช่วยเราหาคำตอบได้หลากหลายวิธีการ จากคำถามหนึ่ง ๆ หรือ ปัญหาหนึ่ง ๆ โดยเป็นวิธีการเชิงลึกมากกว่าที่เคยทำกันมาในอดีต ซึ่งมันช่วยเราแก้ไขปัญหา ที่เราอาจจะไม่เคยพบ และ แก้ไขมาก่อน ลองไปหาข้อมูลเพิ่มดีกว่า จาก ของ Stanford University ให้คำจำกัดความไว้ว่า Machine learning is the science of getting computers to act without being explicitly programmed. Computer Science ซึ่งมุ่งเน้นที่จะสร้างองค์ความรู้จากข้อมูล โดยเริ่มจากการสร้างโมเดลทางคณิตศาสตร์ที่มีความยืดหยุ่น และสามารถปรับตัวเองเข้ากับข้อมูลที่ได้รับ เพื่อที่จะสามารถทำนายอนาคตได้ เทคนิคของ Data Mining ยุคเก่าเช่น regression ก็เป็นส่วนหนึ่งของ Machine Learning เพราะสมการเชิงเส้นก็คือโมเดลทางคณิตศาสตร์อย่างหนึ่งที่มีความยืดหยุ่น และใช้สามารถทำนายอนาคตได้ แต่จุดที่แตกต่างคือเนื่องจาก Machine Learning เป็นศาสตร์ที่ใหม่กว่า โมเดลทางคณิตศาสตร์ที่นับเป็น Machine Learning Model ในปัจจุบันมีจำนวนมาก และโมเดลจะมีความซับซ้อน มีความหลากหลาย และสามารถนำไปใช้งานได้กว้างกว่า ตัวอย่างเช่น เทคโนโลยีที่อยู่เบื้องหลังหุ่นยนต์อัจริยะต่างๆ หรือ เทคโนโลยีการบินแบบไร้คนขับ หรือ ระบบวิเคราะห์ภาพ เสียง ภาพเคลื่อนไหวและภาษามนุษย์ทั้งหลาย ล้วนแล้วแต่อยู่ภายใต้ศาสตร์ของ Machine Learning ทั้งสิ้น ส่วนคำว่า Data Science เป็นคำที่ใหม่ที่สุดและเพิ่งเกิดขึ้นเมื่อไม่กี่ปีมานี้ data scientist หรือนักวิทยาศาสตร์ข้อมูลนั้นส่วนใหญ่จะทำงานในบริษัทที่ต้องการหาความหมายจากข้อมูลในองค์กร และหน้าที่ของ data scientist คือการออกแบบการแสดงข้อมูล visualization การวิเคราะห์ข้อมูลทางสถิติเบื้องต้น รวมไปถึงการใช้ machine learning models เพื่อวิเคราะห์ข้อมูล การสื่อสารผลของการวิเคราะห์ข้อมูลให้แก่ฝ่ายอื่นๆในองค์กร และเสนอแนะการเปลี่ยนแปลงวิธีการในการทำธุรกิจโดยอาศัยผลลัพธ์จากการวิเคราะห์ข้อมูล โดยทั่วไป data scientist ไม่ได้มีหน้าที่ในการวิเคราะห์วิจัยโมเดลทางคณิตศาสตร์ใหม่ๆ หรือพัฒนานวัตกรรมเช่นหุ่นยนต์อัจริยะหรือโปรแกรมคอมพิวเตอร์ที่เข้าใจภาษาคน สิ่งเหล่านี้มักจะเป็นหน้าที่ของวิศวกรที่มีความรู้ทาง machine learning โดยตำแหน่งจะเรียกว่า Machine learning engineer สรุปคือคำว่า Machine Learning, Data Mining, และ Data Science นั้นมีความเกี่ยวพันกันอยู่มาก แต่ก็มีข้อแตกต่าง ปัจจุบันคำว่า Data Mining ถูกใช้เป็นคำทั่วไปที่หมายถึงการดึงองค์ความรู้จากข้อมูลขนาดใหญ่ ส่วน Machine Learning หมายถึงศาสตร์ของการสร้างโมเดลคณิตศาสตร์ที่ปรับตัวตามข้อมูลที่เราได้รับและสามารถนำไปทำนายอนาคต รวมไปถึงการนำแนวคิดนี้ไปประยุกต์สร้างนวัตกรรมใหม่ๆ ส่วน data science หมายถึงการวิเคราะห์ข้อมูลในองค์กรรัฐหรือธุรกิจเพื่อสร้างองค์ความรู้และเสนอแนะวิธีการทำดำเนินธุรกิจที่มีประสิทธิภาพมากขึ้น. เป็นคำถามที่น่าสนใจมาก ๆ ผมเชื่อว่า แต่ละคนย่อมให้ความหมาย และ คำจำกัดความแตกต่างกันไป ตามประสบการณ์ที่พบเจอมา ผมไปอ่านเจอบทความเรื่อง อธิบายได้ดี และ น่าสนใจ จึงนำเอาแปล และ สรุปได้ดังนี้ Machine Learning คืออะไรล่ะ? Overfitting เป็นอีกหนึ่งปัญหาพื้นฐานที่พบบ่อยมากในการพัฒนาอัลกอรึทิ่ม Machine Learning ทำให้เกิดเหตุการณ์ที่ โมเดลทำงาน เช่น ทำนายข้อมูล ได้ดีมากกับ training data in-sample data แต่เมื่อไหร่ก็ตามที่เรานำโมเดลนั้นมาทำงานกัน testing data out-sample data ซึ่งเป็นข้อมูลที่โมเดลไม่เคยเห็นมาก่อน โมเดลกลับทำงานแต่แย่มาก … … Overfitting เกิดจากอะไร? Feature Extraction เป็นกระบวนการแปลงข้อมูลให้อยู่ในรูปแบบ ที่สามารถนำไปใช้งานได้ใน Machine Learning เช่นแปลงจากข้อมูล text และ image ไปอยู่ในรูปแบบชุดของตัวเลข วิธีการนี้จะช่วยลดขนาดข้อมูลที่ต้องประมวลผลลงไปอีกด้วย ซึ่งนั่นคือ การลด resource ที่ต้องใช้การประมวลผล เป็นสิ่งสำคัญมาก ๆ ในโลกของ Big Data 2. Machine learning คือการทำให้คอมพิวเตอร์สามารถเรียนรู้ได้ด้วยตัวเองจากข้อมูลที่มีอยู่ ถ้าให้เปรียบเทียบแบบเห็นภาพชัดเจน คือ เราเป็นครู คอมพิวเตอร์เป็นนักเรียน และความรู้เป็นข้อมูล แต่เดิมเราอยากสอนอะไรนักเรียน เราก็กางหนังสือแล้วถ่ายทอดความรู้ให้กับเด็ก ๆ ซึ่งนักเรียนก็จะเข้าใจความรู้นั้นเป็นก้อน ๆ ไป แต่ Machine learning คือการทำให้นักเรียนสามารถใช้ความรู้ ข้อมูลที่ตัวเองมี ในการวิเคราะห์ เชื่อมโยง คาดการณ์และประมวลผลได้ด้วยตัวเอง โดยไม่ต้องรอให้เราสอน นี่เป็นนิยามของ Machine learning แบบคร่าว ๆ แล้ว Machine learning มันเรียนรู้ด้วยตัวเองได้ยังไง? เนื่องจากมันไม่ได้สนใจสาเหตุ หรือ ผลกระทบที่เกิดขึ้น แต่มันสนใจที่ การทำนาย โดยไม่ต้องเข้าใจว่ามีเหตุและผลอย่างไร แสดงว่า มันต้องคิดได้เองสินะ?
  6. Machine Learning คืออะไร ? ~ Python 3 - แถมให้อีกตัวอย่างหนึ่งแบบใกล้ตั๊ว ใกล้ตัวสุด ๆ นั่นคือการ Tag เพื่อนของเราในรูปที่เราโพสต์บน Facebook แต่ก่อนนู้น เราต้องพิมพ์ชื่อเองใช่ไหมว่าคนนี้คือใคร แต่เดี๋ยวนี้มันแทบจะบอกได้เลยว่าหน้าของคน ๆ นี้คือใครได้เลย สุดยอดมาก หรือรู้มากก็ไม่ทราบ นั่นเป็นเพราะ Facebook มี Machine learning ที่สามารถวิเคราะห์ใบหน้าได้โดยใช้ข้อมูลของผู้ใช้งานนั่นแหละ เวลาเราจิ้มไปที่หน้าของคนนี้ มันก็จะวิเคราะห์แล้วว่า เอาล่ะ! Machine learning คือการทำให้คอมพิวเตอร์สามารถเรียนรู้ได้ด้วยตัวเองจากข้อมูลที่มีอยู่ ถ้าให้เปรียบเทียบแบบเห็นภาพชัดเจน คือ เราเป็นครู คอมพิวเตอร์เป็นนักเรียน และความรู้เป็นข้อมูล แต่เดิมเราอยากสอนอะไรนักเรียน เราก็กางหนังสือแล้วถ่ายทอดความรู้ให้กับเด็ก ๆ ซึ่งนักเรียนก็จะเข้าใจความรู้นั้นเป็นก้อน ๆ ไป แต่ Machine learning คือการทำให้นักเรียนสามารถใช้ความรู้ ข้อมูลที่ตัวเองมี ในการวิเคราะห์ เชื่อมโยง คาดการณ์และประมวลผลได้ด้วยตัวเอง โดยไม่ต้องรอให้เราสอน นี่เป็นนิยามของ Machine learning แบบคร่าว ๆ แล้ว Machine learning มันเรียนรู้ด้วยตัวเองได้ยังไง?

comments powered by Disqus