กรณีศึกษาวิทยาศาสตร์ข้อมูลในโลกแห่งความเป็นจริง, โครงการด้วย Python
ราคา: $89.99
แล้วเราจะทำให้อัลกอริธึมค้นหารูปแบบที่เป็นประโยชน์ในข้อมูลได้อย่างไร? ความแตกต่างที่สำคัญระหว่างการเรียนรู้ของเครื่องและอัลกอริธึมที่ตั้งโปรแกรมแบบทั่วไปคือความสามารถในการประมวลผลข้อมูลโดยไม่ต้องตั้งโปรแกรมไว้อย่างชัดเจน. ซึ่งหมายความว่าวิศวกรไม่จำเป็นต้องให้คำแนะนำที่ซับซ้อนแก่เครื่องจักรเกี่ยวกับวิธีการจัดการบันทึกข้อมูลแต่ละประเภท. แทนที่, เครื่องจะกำหนดกฎเหล่านี้เองโดยอาศัยข้อมูลอินพุต.
โดยไม่คำนึงถึงแอปพลิเคชันการเรียนรู้ของเครื่องโดยเฉพาะ, ขั้นตอนการทำงานทั่วไปยังคงเหมือนเดิมและทำซ้ำซ้ำๆ เมื่อผลลัพธ์ล้าสมัยหรือต้องการความแม่นยำที่สูงขึ้น. ส่วนนี้มุ่งเน้นไปที่การแนะนำแนวคิดพื้นฐานที่ประกอบเป็นเวิร์กโฟลว์แมชชีนเลิร์นนิง.
องค์ประกอบหลักของการดำเนินการแมชชีนเลิร์นนิงคือคณิตศาสตร์ แบบอย่าง, ซึ่งอธิบายวิธีที่อัลกอริทึมประมวลผลข้อมูลใหม่หลังจากได้รับการฝึกอบรมกับชุดย่อยของข้อมูลในอดีต. เป้าหมายของ การฝึกอบรม คือการพัฒนารูปแบบที่สามารถกำหนดรูปแบบได้ มูลค่าเป้าหมาย (คุณลักษณะ), ค่าที่ไม่รู้จักของวัตถุข้อมูลแต่ละรายการ. ขณะนี้ฟังดูซับซ้อน, มันไม่ใช่จริงๆ.
ตัวอย่างเช่น, คุณต้องคาดการณ์ว่าลูกค้าของร้านอีคอมเมิร์ซของคุณจะซื้อสินค้าหรือออกไป. คำทำนายเหล่านี้ ซื้อ หรือ ออกจาก คือคุณสมบัติเป้าหมายที่เรากำลังมองหา. หากต้องการฝึกโมเดลให้ทำการคาดการณ์ประเภทนี้ คุณต้อง "ป้อน" อัลกอริทึมด้วย ชุดข้อมูล ที่เก็บบันทึกพฤติกรรมของลูกค้าและผลลัพธ์ต่างๆ (ไม่ว่าลูกค้าจะออกไปหรือซื้อสินค้าก็ตาม). ด้วยการเรียนรู้จากข้อมูลในอดีตนี้ แบบจำลองจะสามารถคาดการณ์ข้อมูลในอนาคตได้.
เวิร์กโฟลว์การเรียนรู้ของเครื่อง
โดยทั่วไป, ขั้นตอนการทำงานทำตามขั้นตอนง่ายๆ เหล่านี้:
-
เก็บข้อมูล. ใช้โครงสร้างพื้นฐานดิจิทัลของคุณและแหล่งข้อมูลอื่นๆ เพื่อรวบรวมบันทึกที่มีประโยชน์มากที่สุดเท่าที่จะเป็นไปได้ และรวมเข้าเป็นชุดข้อมูล.
-
เตรียมข้อมูล. เตรียมข้อมูลของคุณเพื่อการประมวลผลในวิธีที่ดีที่สุดเท่าที่จะเป็นไปได้. ขั้นตอนการประมวลผลล่วงหน้าและการทำความสะอาดข้อมูลอาจค่อนข้างซับซ้อน, แต่โดยปกติแล้ว, พวกเขามุ่งเป้าไปที่การเติมค่าที่หายไปและแก้ไขข้อบกพร่องอื่นๆ ในข้อมูล, เช่น การแสดงค่าเดียวกันที่แตกต่างกันในคอลัมน์ (เช่น. ธันวาคม 14, 2016 และ 12.14.2016 จะไม่ได้รับการปฏิบัติแบบเดียวกันโดยอัลกอริธึม).
-
แยกข้อมูล. แยกชุดย่อยของข้อมูลเพื่อฝึกโมเดลและประเมินเพิ่มเติมว่าโมเดลทำงานอย่างไรเทียบกับข้อมูลใหม่.
-
ฝึกโมเดล. ใช้ชุดย่อยของข้อมูลในอดีตเพื่อให้อัลกอริทึมจดจำรูปแบบในนั้น.
-
ทดสอบและตรวจสอบแบบจำลอง. ประเมินประสิทธิภาพของแบบจำลองโดยใช้ชุดย่อยการทดสอบและการตรวจสอบความถูกต้องของข้อมูลในอดีต และทำความเข้าใจว่าการคาดการณ์มีความแม่นยำเพียงใด.
-
ปรับใช้โมเดล. ฝังโมเดลที่ทดสอบแล้วลงในเฟรมเวิร์กการตัดสินใจของคุณโดยเป็นส่วนหนึ่งของโซลูชันการวิเคราะห์หรือให้ผู้ใช้ใช้ประโยชน์จากความสามารถของโมเดล (เช่น. กำหนดเป้าหมายคำแนะนำผลิตภัณฑ์ของคุณได้ดีขึ้น).
-
ย้ำ. รวบรวมข้อมูลใหม่หลังจากใช้แบบจำลองเพื่อปรับปรุงแบบค่อยเป็นค่อยไป.
ทิ้งคำตอบไว้
คุณต้อง เข้าสู่ระบบ หรือ ลงทะเบียน เพื่อเพิ่มความคิดเห็นใหม่ .