Data Mining เมื่อต้องขุดหาอะไรบางอย่างจากเหมืองข้อมูล ?

หน้าแรก เอ็มไอเอส/อีบิสสิเนส

Data Mining เมื่อต้องขุดหาอะไรบางอย่างจากเหมืองข้อมูล ?

อัปเดท : 15 มิถุนายน พ.ศ.2546 , แสดง : 122,461 , ความคิดเห็น : 16

เดต้าไมนิ่ง(Data Mining) ถ้าแปลตรงๆ คือเหมืองข้อมูล คล้ายกับเหมืองแร่ ที่ขุดดินมาเยอะแต่ใด้แร่นิดเดียว เดต้าไมนิ่งเป็นศาสตร์แขนงหนึ่งทาง AI (Artificial Intelligence) ดังนั้นข้อมูลที่จะพูดถึงต่อไป ท่านที่เคยศึกษา ด้าน AI (Artificial Intelligence) มาบ้างอาจคุ้นเคยเพราะหลายเทคนิคใน AI (Artificial Intelligence) ได้นำมาใช้กับเดต้าไมนิ่ง เดต้าไมนิ่งเป็นการค้นหาความสัมพันธ์และรูปแบบทั้งหมด ซึ่งมีอยู่จริงในฐานข้อมูล ซึ่งสัมพันธ์และรูปแบบเหล่านั้นได้ถูกซ่อนไว้ภายในข้อมูลจํานวนมากที่มีอยู่ เดต้าไมนิ่งจะทําการสํารวจและวิเคราะห์ข้อมูลให้อยู่ในรูปแบบที่เต็มไปด้วยความหมายและอยู่ในรูปของกฎ โดยความสัมพันธ์หน่วยนี้แสดงให้เห็นถึงความรู้ต่าง ๆ (Knowledge) ที่มีประโยชน์ในฐานข้อมูลในปัจจุบันองค์กรธุรกิจส่วนใหญ่เผชิญกับปัญหาของ ข้อมูลดิบจํานวนมากแต่ข้อมูลที่ประยุกต์ใช้ได้นั้นมีน้อย เดต้าไมนิ่งจึงเป็นสาขาที่คาดว่าจะเป็นที่รู้จักและนํามาใช้ประยุกต์ใช้อย่างแพร่หลายเนื่องจากเดต้าไมนิ่งสามารถดึงคามรู้ออกมาจากข้อมูลจํานวนมากที่ถูกเก็บสะสมและซ่อนไว้

ในโลกปัจจุบันธุรกิจต่างๆจะพยายามหาเทคนิคที่สามารถนําความสําเร็จมาสู่บริษัท เช่น ในโลกธุรกิจขนาดย่อมจะสร้างความสัมพันธ์กับลูกค้า โดยสังเกตจากความต้องการ ความชอบและความสนใจของลูกค้า และอาจมีการเรียนรู้ได้จากผลสะท้อนในอดีต ว่าจะทําอย่างไรให้การบริการลูกค่ามีประสิทธิภาพดีขึ้นในอนาคต เช่น บริษัทที่เป็นผู้ออกบัตรเครดิตและธนาคารต่างๆ จะมีขบวนการที่ใช้เดต้าไมนิ่งให้เป็นประโยชน์ ในการตัดสินใจว่าลูกค่ากลุ่มใดเป็นกลุ่มที่ดี ทําความเข้าใจลูกค่า ช่วยในการแยกประเภทของลูกค้าและจะทํานายกลุ่มของประชากรที่คาดว่าจะมาเป็นลูกค้าในอนาคต เป็นต้น อย่างไรก็ตามการเรียนรู้นั้นต้องมากกว่าการเก็บสะสมข้อมูลอย่างตรงไปตรงมา ซึ่งจะทําให้การทํางานเป็นไป
อย่างมีประสิทธิภาพ

วัฎจักรขั้นตอนการทํางานของเดต้าไมนิ่ง วัฎจักรขั้นตอนการทํางานของเดต้าไมนิ่งประกอบไปด้วย 4 ขั้นตอนหลักๆ ดังนี้
1. การระบุโอกาสทางธุรกิจหรือการระบุปัญหาที่เกิดขึ้นกับธุรกิจ
เป็นการระบุขอบเขตของข้อมูลที่จะนํามาทําการวิเคราะห์เพื่อหาความได้เปรียบทางการตลาดหรือเพื่อนํามาทําการแก้ไขปัญหา

2. ส่วนของเดต้าไมนิ่ง
เป็นการนําเทคนิคของเดต้าไมนิ่ง ไปใช้ถ้ายทอดหรือทําการเปลี่ยนแปลงข้อมูลดิบให้อยู่ในรูปของข้อมูลที่จะนําไปใช้ได้จริงในทางธุรกิจ

3. การปฏิบัติตามข้อมูล
คือการนําเอาข้อมูลที่เป็นผลลัพธ์ของส่วนเดต้าไมนิ่งมาลองปฏิบัติจริงกับธุรกิจ

4. การวัดประสิทธิภาพจากผลลัพธ์
การวัดประสิทธิภาพของเทคนิคของเดต้าไมนิ่งที่จะนํามาใช้จากผลลัพธ์ ซึ่งสามารถตรวจสอบได้หลายทาง เช่น วัดจากส่วนแบ่งของตลาด วัดจากปริมาณลูกค่า หรือ วัดจากกําไรสุทธิ เป็นต้น จากทั้ง 4 ขั้นตอนที่กล่าวมาข้างต้นคือการนําเอาเดต้าไมนิ่งไปใช้กับระบบทางธุรกิจ โดยแต่ละขั้นตอนจะพึ่งพาอาศัยกันผลลัพธ์จากขั้นตอนหนึ่งจะกลายมาเป็นอินพุทจากอีกขั้นตอนต่อไป ซึ่งเดต้าไมนิ่งจะเปลี่ยนข้อมูลดิบให้เป็นข้อมูลประยุกต์ ดังนั้นการระบุแหล่งข้อมูลที่ถูกต้องจึงเป็นสิ่งที่สําคัญอย่างยิ่งต่อผลลัพธ์ที่ได้จากการวิเคราะห์

งานของเดต้าไมนิ่ง (Task of data mining)

ในทางปฏิบัติจริงเดต้าไมนิ่งจะประสบความสําเร็จกับงานบางกลุ่มเท่านั้น และต้องอยู่ภายใต้ภาวะที่จํากัดปัญหาเหมาะสมกับการใช้เทคนิคเดต้าไมนิ่งจะเป็นปัญหาที่ต้องใช้เหตุผลในการแก้ เป็นปัญหาที่เกี่ยวข้องกับเศรษฐศาสตร์และการเงิน ซึ่งจะสามารถจัดรูปแบบของธุรกิจให้อยู่ในรูปแบบของงานทั้ง 6 งานได้ ดังนี้

1. การจัดหมวดหมู่ (Classification)
2. การประเมินค่า (Estimation)
3. การทํานายล่วงหน้า (Prediction)
4. การจัดกลุ่มโดยอาศัยความใกล้ชิด (Affinity Group)
5. การรวมตัว (Clustering)
6. การบรรยาย (Description)
ไม่มีเทคนิคหรือเครื่องมือเพียงชนิดเดียวของเดต้าไมนิ่งที่เหมาะสมกับงานทุกชนิด งานในแต่ละชนิดก็จะมีเทคนิคของเดต้าไมนิ่งที่แตกต่างกันไปขึ้นอยู่กับชนิดของงาน

1. การจัดหมวดหมู่
การจัดหมวดหมู่ถือว่าเป็นงานธรรมดาทั่วไปของเดต้าไมนิ่ง เพราะการทําความเข้าใจและการติดต่อสื่อสารต่างๆ ก็เกี่ยวข้องกับการแบ่งเป็นหมวดหมู่การจัดแยกประเภทและการแบ่งแยกชนิดโดยการจัดหมวดหมู่ประกอบด้วยการสํารวจจุดเด่นของวัตถุที่ปรากฏออกมา และทําการกําหนด จุดเด่นนั้นๆ เป็นตัวที่ใช้แบ่งหมวดหมู่ งานในการแบ่งหมวดหมู่คือการบ?งบอกลักษณะ โดยการอธิบายจุดเด่นที่เป็นที่รู้จักดีในหมวดหมู่นั้น และเทรนนิ่งเซต (TrAI (Artificial Intelligence) ning Set) ของตัวอย่างในแต่ละหมวดหมู่ ซึ่งมีภาระหน้าที่ในการสร้างโมเดลของบางชนิดที่ไม่สามารถจะจัดหมวดหมู่ของข้อมูลได้ ให้สามารถจัดเป็น หมวดหมู่ได้ ตัวอย่างของการจัดหมวดหมู่ เช่น การจัดหมวดหมู่ของผู้ยื่นขอเครดิต (Credits) เป็นระดับต่ำระดับกลาง และระดับสูง ของความเสี่ยงที่จะได้รับ เป็นต้น

2. การประเมินค่า
การประเมินค่าทางธุรกิจอย่างต่อเนื่องจะก่อให้เกิดผลลัพธ์ที่มีประโยชน์กับธุรกิจ การป้อนข้อมูล
ที่เรามีอยู่เข้าไป เพื่อใช้ในการประเมินสิ่งต่างๆ ที่จะก่อให้เกิดประโยชน์ หรือสําหรับตัวแปรที่เราไม่รู้ค่า แน่นอนเช่น รายได้จากการค่า จุดสูงสุดทางธุรกิจ หรือดุลยภาพของบัตรเครดิต ในทางปฏิบัติการประเมิน ค่าจะถูกใช้ในการทํางานการจัดหมวดหมู่ ตัวอย่างของการประเมินค่าเช่น การประเมินรายได้รวมของ ครอบครัว หรือการประเมินจํานวนบุตรในครอบครัว

3. การทํานายล่วงหน้า
การทํานายล่วงหน้าก็เป็นงานที่มีลักษณะคล้ายกับการจัดหมวดหมู่หรือการประเมินค่า ยกเว้น เพียงแต่จะใช้สถิติการบันทึกของการจัดหมวดหมู่ในการทํานายอนาคตของพฤติกรรมหรือการประเมิน ค่าที่จะเกิดขึ้นในอนาคต ตัวอย่างของงานการทํานายล่วงหน้า เช่น การทํานายการเปลี่ยนแปลงพฤติกรรม ของตลาด หรือการทํานายจํานวนลูกค่าที่จะออกจากธุรกิจของเราใน 6 เดือนข้างหน้า เป็นต้น

4. การจัดกลุ่มโดยอาศัยความใกล้ชิดกัน หรือการวิเคราะห์ของตลาด
งานในการจัดกลุ่มหรือการวิเคราะห์ตลาด คือการตัดสินใจรวมสิ่งที่สามารถไปด้วยกันเข้าไว้ในกลุ่มเดียวกันตัวอย่างของการจัดกลุ่มโดยอาศัยความใกล้ชิดกันหรือการวิเคราะห์ตลาด เช่น การตัดสินใจว่าสิ่งใดบ้างที่จะไปอยู่ด้วยกันอย่างสม่ำเสมอในรถเข็นในซุปเปอร์มาร์เกต

5. การรวมตัว
การรวมตัวคืองานที่ทําการรวมส่วนต่างๆ ในแต่ละส่วนที่ต่างชนิดกันให้อยู่ในรวมกันเป็นกลุ่มย่อย หรือคลัสเตอร์ (Clusters) โดยในแต่ละคลัสเตอร์อาจจะประกอบด้วยส่วนต่างๆที่ต่างชนิดกัน ซึ่งความแตกต่างของการรวมตัวจากการจัดหมวดหมู่คือ การรวมตัวจะไม่พึ่งพาอาศัยการกําหนดหมวดหมู่ล่วงหน้า และไม่ใช้ตัวอย่าง ข้อมูลจะรวมตัวกันบนพื้นฐานของความคล้ายในตัวเอง

6. การบรรยาย
ในบางครั้งวัตถุประสงค์ของเดต้าไมนิ่ง คือต้องการอธิบายความสับสนของฐานข้อมูลในทางที่จะเพิ่มความเข้าใจในส่วนของประชากร ผลิตภัณฑ์ หรือขบวนการให้มากขึ้น เทคนิคเดต้าไมนิ่งส่วนใหญ่ต้องการเทรนนิ่งข้อมูลจํานวนมากที่ประกอบด้วยหลายๆ ตัวอย่างเพื่อจะสร้างกฎที่ใช้ในการจัดหมวดหมู่ กฎของความสัมพันธ์ คลัสเตอร์ การทํานายล่วงหน้า ดังนั้นชุดของข้อมูลขนาดเล็กจะนําไปสู่ความไม่น่าไว้วางใจของผลสรุปทีได้ ไม่มีเทคนิคใดเลยที่จะสามารถแก้ปัญหาของเดต้าไมนิ่งได้ทุกปัญหา ดังนั้นความหลากหลายของเทคนิคจึงเป็นสิ่งที่จําเป็นในการไปสู่วิธีการแก้ปัญหาของเดต้าไมนิ่งได้ดีที่สุด

เทคนิคของเดต้าไมนิ่ง

การแก้ปัญหาของงานชนิดต่างๆ โดยใช้วิธีเดต้าไมนิ่ง ในแต่ละงานก็จะมีเทคนิคของเดต้าไมนิ่งที่จะนํามาใช้ได้อย่างเหมาะสม โดยเทคนิคของเดต้าไมนิ่งนั้นมีมากมาย ส่วนใหญ่มาจากศาสตร์ทาง AI (Artificial Intelligence) หรือศาสตร์อื่นๆ ซึ่งจะขอยกตัวอย่างของเทคนิคที่ถูกใช้กันค่อนข้างแพร่หลาย

1. ดีซีชันทรี ( Decision Tree )
เป็นแบบจําลองที่มีลักษณะคล้ายกับต้นไม้ จะมีการสร้างกฎต่างๆ ขึ้นเพื่อใช้ในการตัดสินใจ ดีซีชันทรีเป็นวิธีที่ได้รับความนิยม เนื่องจากความไม่ซับซ่อนของอัลกอริทึม ทําให้เครื่องมือที่ใช้ในการทําที่วางขายกันอยู่ในท้องตลาด ต่างก็ใช้วิธีนี้ข้อดีของวิธีนี้คือ สามารถตีความและเข้าใจลักษณะของรูปแบบข้อมูล ( Pattern ) ได้ง่าย เพราะ มีการแยกออกเป็นกฎ หรือข้อกําหนดต่างๆ แต่ก็ยังคงมีปัญหาในเรื่องของการให้น้ำหนักความน่าเชื่อถือหรือการให้ค่าน้ำหนักในแต่ละโหนด (node) ซึ่งถ้าให้น้ำหนักผิดไป อาจจะทําให้การตีความผิดไปได้

2. คลัสเตอร์ลิ่ง ( Clustering )
วิธีคลัสเตอร์ลิ่งนี้เป็นวิธีที่อาจจะเรียกว่าเป็นการทําเดต้าไมนิ่งแบบอ้อมๆ ก็ว่าได้ เนื่องจากการหาผลลัพธ์ในแต่ละครั้งนั้น แม้กระทั่งผู้หายังไม่อาจจะทราบว่าสิ่งที่ต้องการจะหานั้นคืออะไร จําเป็นต้องรอจนกว่าการค้นหาจะทําเสร็จสมบูรณ์จึงจะทราบข้อมูลที่ซ่อนอยู่ เปรียบเสมือนกับการมีข้อมูลจํานวนมากมายอยู่ในตะกร้า แล้วจากนั้นก็มีเวทย์มนต์มาจัดเรียงข้อมูลหน่วยนั้นให้อยู่เป็นกลุ่มก?อนซึ่งทําให้สังเกตลักษณะเด่นที่ซ่อนเร้นอยู่ภายในข้อมูลจํานวนมากหน่วยนั้น

3. นิวรอนเน็ตเวิร์ก ( Neuron Network )
นิวรอนเน็ตเวิร์ก คือระบบทีมีการประมวลผลข้อมูลซึ่งรวมคุณสมบัติของไบโอลอจิกคอลนิวรอนเน็ตเวิร์ก ถูกพัฒนาขึ้นโดยโมเดลทางคณิตศาสตร์ของกระบวนการเรียนรู้ของมนุษย์ (เลียนแบบการทำงานของสมอง) และจะเรียนรู้
จากชุดข้อมูลของชุดความรู้เทรนนิ่งเซท นิวรอนเน็ตเวิร์ก ประกอบด้วยหน่วยความจําจํานวนมากเรียกว่า นิวรอน (Neurons) เซล (Cells) หรือโหนด (Nodes) แต่ละนิวรอนต่อกันโดยคอนเน็กชั้นลิงค์ (Connection Link) ที่มีค่าน้ำหนักของมันอยู่ ในแต่ละการเชื่อมต่อ โดยค่าน้ำหนักจะแสดงรายละเอียดที่เน็ตเวิร์กใช้ในการแก้ปัญหา โดยนิวรอนเนต เวิร์กถูกใช้ในการแก้ปัญหาอย่างกว่างขวาง เช่น การเก็บและการเรียกข้อมูล การแยกประเภทของข้อมูล การเปลี่ยนจากรูปแบบของอินพุท (Input) ให้อยู่ในรูปแบบของเอาท์พุท (Output) ความสามารถในการ ตรวจสอบรูปแบบของข้อมูลที่คล้ายคลึงกับความคิดของมนุษย์ เป็นต้น ถึงแม้ว่านิวรอนเน็ตเวิร์ก สามารถ นําไปประยุกต์ใช้กับงานหลายๆ ชนิดได้อย่างมีประสิทธิภาพ แต่นิวรอนเน็ตเวิร์ก ก็ยังมีข้อเสียอยู่บ้าง ดังนี้

3.1. นิวรอนเน็ตเวิร์กเป็นวิธีที่ยากต่อการทําความเข้าใจในโมเดลที่ถูกผลิตออกมา

3.2. นิวรอนเน็ตเวิร์กมีคุณสมบัติที่ไวต่อรูปแบบของอินพุท ถ้าเราแทนข้อมูลด้วยรูปแบบที่ แตกต่างกันก็จะสามารถผลิตผลลัพธ์ที่แตกต่างกันออกมา ดังนั้นการกําหนดค่าเริ่มต้นให้กับ ข้อมูลจึงเป็นส่วนที่มีความสําคัญส่วนหนึ่ง

4. จีเนติก อัลกอริทึ่ม ( Genetic Algorithms : GA )
จีเนติก อัลกอริทึ่ม เป็นทฤษฎีที่จําลองกระบวนการวิวัฒนาการทางธรรมชาติ คือการคัดเลือกทาง ธรรมชาติ และอาศัยพื้นฐานความคิดทางพันธุกรรมในการถ่ายทอดลักษณะต่างๆ ไปยังรุ่นถัดไป ที่ สามารถนํามาพัฒนาใช้ในการหาคําตอบที่เหมาะสมที่สุดของแต่ละปัญหา จีเนติก อัลกอริทึ่มเป็นวิธีการหาคําตอบโดยการพิจารณา และดําเนินการจากกลุ่มของคําตอบของ ปัญหาที่ถูกสร้างขึ้นมาโดยการเข้ารหัส คือการแปลงค่าตัวแปรหรือพารามิเตอร์ (Parameters) ของปัญหา ให้อยู่ในรูปโครงสร้างของโครโมโซม (Cromosomes) ที่กําหนด เพื่อคัดเลือกโครโมโซมคําตอบที่ เหมาะสมสําหรับสร้างวิวัฒนาการของคําตอบให้ดีขึ้นตามกระบวนการทางพันธุศาสตร์ โดยการแลกเปลี่ยนค่าพารามิเตอร์ต่างๆ ระหว่างโครโมโซมที่ถูกคัดเลือกอันจะทําให้คําตอบของปัญหาถูก ปรับปรุงให้ดีขึ้น จีเนติก อัลกอริทึ่มใช้ขั้นตอนหลักๆ 3 กระบวนการในการหาคําตอบที่ใกล้เคียงหรือดีที่สุด ของปัญหาดังนี้

4.1. การคัดเลือก (Selection) : คัดเลือกอันที่ดีที่สุดซึ่งจริงๆแล้วถ้าผ่านขั้นตอนต่อไปอาจจะเป็นค่าที่ใช้ไม่ได้ก็ได้

4.2. การสับเปลี่ยนค่าโครโมโซม (Crossover) : ค่าจากขั้นตอนที่ 1. มาสับเปลี่ยน bit เพื่อประเมินแล้วเลือก

4.3. การกลายพันธุ์ (Mutation) : ค่าจากขั้นตอนที่ 3. นำมากลับ Bit จาก 0 เป็น 1 เพื่อประเมินแล้วกลับไปขั้นตอนที่ 1. อีกครั้ง *

* ศึกษารายละเอียดเพิ่มเติมหาอ่านได้จากหนังสือ Artificial Intelligence ซึ่งทุกเล่มจะพูดถึงจีเนติก อัลกอริทึ่ม (Genetic Algorithms)
ถึงแม้ว่าในปัจจุบันจีเนติก อัลกอริทึ่ม ยังเป็นวิธีการที่ไม่ได้แพร่หลายนัก แต่สาขาวิชาทางด้าน จีเนติก อัลกอริทึ่มก็นับว่าเป็นอีกสาขาวิชาหนึ่งที่สนใจและน่าจะเป็นวิธีที่ได้รับความนิยมในอีกไม่กี่ปี ข้างหน้า เนื่องมาจากสามารถนํามาประยุกต์ใช้ได้กับหลายๆ ปัญหารวมทั้งปัญหาทางเดต้าไมนิ่งอีกด้วย

สรุป

เดต้าไมนิ่งคือการค้นหาความสัมพันธ์และรูปแบบทั้งหมด ซึ่งมีอยู่จริงในฐานข้อมูล แต่ได้ถูก ซ่อนไว้ภายในข้อมูลจํานวนมาก โดยเดต้าไมนิ่งจะเหมาะสมกับการ แก้ปัญหาบางชนิดเท่านั้น เช่น ปัญหาที่ต้องใช้เหตุผลในการแก้ หรือปัญหาที่เกี่ยวข้องกับเศรษฐศาสตร์ และการเงิน เป็นต้น เดต้าไมนิ่งมีเทคนิคต่าง ๆ ที่ใช้ในการแก้ปัญหาอยู่หลายเทคนิค ซึ่งจะไม่มีเทคนิคใดเลยที่ สามารถแก้ปัญหาของเดต้าไมนิ่งได้ทุกปัญหา ดังนั้นความหลากหลายของเทคนิคเป็นสิ่งที่จําเป็นที่จะนําไปสู่วิธีการแก้ปัญหาที่ดีที่สุด ของเดต้าไมนิ่ง

ผู้เขียน/อ้างอิง : จักรกฤษณ์ แร่ทอง

เอ็มไอเอส/อีบิสสิเนส

Paypal.com ธุรกิจบริการโอนและชำระเงินระหว่างบุคคลกับบุคคล
Paypal Inc. (www.paypal.com) เป็น (C-to-C Payment) หรือระหว่างบุคคลกับบุคคล (P-to-P Payment) ที่ใหญ่ที่สุดใน
Amazon.com, Inc ร้านขายหนังสือออนไลน์ที่ใหญ่ที่สุดในโลก
Amazon.com, Inc (www.amazon.com) เป็นร้านขายหนังสือออนไลน์ที่ใหญ่ที่สุดในโลก บริษัทเริ่มดำเนินการ ตั้งแต่ปี 1995
เผยโฉม 10 กลโกงทางอินเทอร์เน็ต (Internet Fraud)
เผยโฉม 10 กลโกงทางอินเทอร์เน็ต (Internet Fraud) ลักษณะและวิธีการป้องกัน
Outsource คือะไร ?
กระบวนการที่องค์กรใดองค์กรหนึ่งที่จะมอบหมายการบริหาร
การวิเคราะห์ปรับกลยุทธ์และวาง Concept ของ Web
การทำการค้าบนเว็บ ก็ไม่ได้แตกต่างจากการทำการค้าปกติทั่วไป
เคล็ดลับการเกาะติดและวิเคราะห์จุดอ่อนคู่แข่งบนเว็บ
เมื่อการแข่งขันบนเว็บเปลี่ยนแปลงไปอย่างรวดเร็วมาก
กลยุทธ์การค้าแบบ B2C, B2B และ E-X-Commerce
ะเลือกค้าแบบ Business-to-Consumer (B-to-C) หรือ Business-to-Business (B-to-B) ดี?
Data Mining เมื่อต้องขุดหาอะไรบางอย่างจากเหมืองข้อมูล ?
ศาสตร์แขนงหนึ่งทาง AI (Artificial Intelligence)
วัฒนธรรมองค์การ กับ ลิง
วัฒนธรรมองค์การ กับ ลิง

ความคิดเห็น/แนะนำ/ติชม/อื่นๆ

jakravut [08 Jan 2005 , 03:09 PM]
อยากจ้างทำ data mining ซึ่ง อาจารย์กำลังสอน และให้ทำรายงานส่ง (โปรเจคของแต่ละคน)
ที [29 Jan 2005 , 12:26 PM]
ผมต้องการเนื้อหาข้อมูลตรงนี้เรื่อง Data mining วิธีการทำงานของโปรแกรมเพื่อนทำรายงานครับช่วยกรุณาตอบข้อมูลดังกล่าวผมด้วยครับว
yaowaret jantakat [16 May 2005 , 10:34 AM]
I am interesting about datamining because i would like to research it. So, I want to find Webbroad for datamining discussion.Can you suggest me about Web of datamining?
aiw [29 Jul 2005 , 05:11 PM]
ไม่ทราบพอจะบอกเนื้อหาของ นิวรอนเน็ตเวิร์ก ( Neuron Network )ได้มั้ยค่ะ หรือบอกข้อมูลที่จะสามารถได้เนื้อหาของ นิวรอนเน็ตเวิร์ก ( Neuron Network ) กรุณาตอบด้วยนะค่ะ ขอร้อง
khonglai [11 Sep 2005 , 12:28 PM]
มีตัวอย่างการใช้จีเนติกอัลกอรืทึมมาใช้ในการสืบค้นเอกสารไม๊คะ..อยากรู้วิธีการมากๆๆเลยค่ะ
ชุลีพร สีนอเพีย [24 ม.ค. 2549 , 01:03 PM]
ดิฉันได้ทำสัมนาเกี่ยวกับ web web mining for web personalization ตอนนี้กำลังหาข้อมูล เเละงานวิจัยที่เกี่ยวข้อง จึงขอรบกวนให้ช่วยเเนะนำข้อมูลที่เกี่ยวข้องให้ด้วยนะคะ
R [24 ก.พ. 2549 , 08:39 PM]
อยากทำโปรเจค(โปรเจค ปี4 ค่ะ)เกี่ยวกับ data mining ค่ะ ควรศึกษาเรื่องอะไรดีค่ะที่น่าสนใจ เป็นที่สนใจของคนส่วนใหญ่ ช่วยแนะนำหน่อยนะค่ะ
อัญ [06 ก.ค. 2549 , 02:01 PM]
อยากทราบว่า Data mining คืออะไร มีลักษณะอย่างไร การทำงานภาพรวมมีลักษณะอย่างไรและแตกต่างจากData warehouse อย่างไร
suwatchai [07 ก.ย. 2549 , 06:12 PM]
อยากทราบว่าจะใช้จีเนติก อัลกอริทึ่ม ( Genetic Algorithms : GA )จำแนกเสียงได้หรือไม่ ถ้าทำได้ช่วยให้ข้อมูลด้วย [email protected]
a [21 พ.ค. 2550 , 08:16 AM]
Data Warehouse กับ Data Mining ต่างกันอย่างไร? บางคนเก็บข้อมูลไว้เต็มเลย เช่น อาจจะมีข้อมูลลูกค้ากว่า 80 กิกะไบต์ แต่ใช้ไม่เป็นเลย เวลาจะหาลูกค้ารายหนึ่งต้องวิ่ง Search ไปเป็นชั่วโมงยังหาไม่เจอเลย อย่างนี้เท่ากับคุณมีโกดังเก็บข้อมูลเต็มไปหมด แต่คุณไม่รู้จักร่อนข้อมูลให้เป็น คุณจะต้องมีซอฟต์แวร์เพื่อที่จะร่อนข้อมูลที่ต้องการออกมา นั่นคือ Data Mining ยกตัวอย่าง การจะเก็บข้อมูลของประชากรที่เลี้ยงสุนัข เพื่อขายอาหารสุนัข ซึ่งแน่นอนว่า ประชากรทั้ง 60 ล้าน คงไม่เลี้ยงสุนัขกันทุกคน คุณรู้ว่ากลุ่มเป้าหมายมีอยู่กลุ่มเดียว ฐานข้อมูลพวกนี้คุณสามารถเก็บได้จากเจ้าของสุนัข ซึ่งอนาคตได้ข่าวว่า จะมีการขึ้นทะเบียน ถ้ามีทะเบียนขึ้นมาตรงนี้คุณพอจะรู้เลย และสามารถเอาฐานข้อมูลตรงนั้นมาทำตลาดได้ แล้วถ้าคุณสามารถเอาสินค้าที่ขายผ่านช่องทางการจัดจำหน่ายตัวนั้นออกไป ให้ลูกค้ากรอกข้อมูลกลับมา โดยมีสิ่งตอบแทนที่เขาอุตส่าห์เสียเวลาเขียนข้อมูลให้คุณ เช่น หมาพันธุ์อะไร อายุเท่าไร? กินอาหารอะไร? ซึ่งตรงนี้จะเป็นข้อมูลที่คุณสามารถใช้ประโยชน์ในการทำ Data Mining ในอนาคต การทำความรู้จักกับผู้บริโภคของคุณนั้น คุณจะต้องมียุทธศาสตร์ทางด้านการตลาดที่แข็งแกร่ง คุณจะต้องทราบว่า ผู้บริโภคอยู่ตรงไหน? แล้วก็จะต้องมีข้อมูลทางด้านจิตวิทยา และทางด้านสำมะโนประชากร (Demographic) ว่า เป็นอย่างไร? ในขณะที่ฝ่ายบริหารการตลาดทุกวันนี้ ส่วนมากจะทำการตลาดแบบง่ายๆ ก็คือ ลดราคา ลดต้นทุนการผลิต เพราะฉะนั้น คุณจะต้องทำอย่างไร? บางแห่งก็บอกว่า ต้นทุนของการหาลูกค้าใหม่อยู่ที่ประมาณ 6-10 เท่าตัวมากกว่าต้นทุนของการรักษาลูกค้าเก่า เพราะฉะนั้น ถ้าคุณกำลังรับผิดชอบงานทางด้านการตลาดอยู่ โดยที่คุณมีลูกค้าอยู่จำนวนหนึ่ง ถ้าคุณไปหาลูกค้าใหม่อีก 10,000 คน แล้วคุณเสียลูกค้าเก่าอีก 5,000 คน หรือเผลอๆ คุณได้ลูกค้าใหม่ 10,000 คน แต่คุณเสียลูกค้าเก่าไป 30,000 คน ถามว่า คุ้มกันไหม? เพราะฉะนั้น ที่กล่าวว่า ต้นทุนของการหาลูกค้าใหม่แพงกว่าต้นทุนของการรักษาลูกค้าเก่า ประมาณ 6-10 เท่าตัว วิธีการ คือ ทำอย่างไรจึงจะสามารถรักษาลูกค้าเก่ามากที่สุด แล้วเอาชนะใจเขา แล้วให้เขาซื้อสินค้าเรามากขึ้น นั่นคือวิธีที่เราต้องการ คุณจำเป็นที่จะต้องสร้างความจงรักภักดีให้เกิดกับลูกค้าของคุณ และความจงรักภักดีของลูกค้าต่อคุณนั้น คือ สิ่งที่คุณปฏิบัติต่อลูกค้าคุณ เกี่ยวกับเรื่องสินค้าคุณอย่างคงเส้นคงวาครับ! นอกจากนี้ เรายังต้องพัฒนาและให้ความรู้แก่ผู้บริโภคของเราด้วย เราต้องการผู้บริโภคที่ฉลาดตามเรา หรือไม่แน่อาจจะฉลาดกว่าเรา เราต้องบอกเขาว่า เราต้องการอยากจะรู้ว่าเขาเป็นอย่างไร? อยากจะให้เขาได้มีโอกาสสัมผัสสินค้าหรือบริการของเรา ฉะนั้น เราจะต้องมีข้อมูลเกี่ยวกับผู้บริโภคมากที่สุดเท่าที่จะมากได้ กับจะต้องสร้างลูกค้าที่มีคุณค่าตลอดชีวิตขึ้นมา (Customer Lifetime Value) เพราะเราต้องการให้ลูกค้าอยู่กับเราตลอดชีวิต มมตินะครับ ถ้าคุณทำให้คนที่ดื่มโค้กไม่พอใจคุณ ถ้าเขาอายุแค่ 15 ปี แล้วคาดว่าเขาจะตายตอนอายุ 75 ปี ตกลงเขามีโอกาสบริโภคโค้ก 60 ปี ถ้าคุณทำให้คนนี้ไม่พอใจโค้กขึ้นมา แล้วเขาดื่มวันละ 2 กระป๋อง ตกลงคุณสูญเสียค่าโอกาสไม่ใช่ 13 บาทหรือ 1 กระป๋อง แต่คุณจะเสียโอกาสทั้งหมดกว่า 5 แสนบาท คิดจากมูลค่า ณ ปัจจุบันนะครับ โดยการคำนวณจากการบริโภคโค้กกระป๋องละ 13 บาท วันละ 2 กระป๋อง คูณด้วยจำนวน 365 วัน คูณด้วย 60 ปี ตามสูตรดังนี้ 13x2x365x60 ปี ข้อสำคัญ คุณต้องตระหนักด้วยนะครับว่า ใครจะมาเป็นพนักงานขายให้กับสินค้าของคุณได้ดีที่สุดเท่ากับลูกค้าของคุณ นี่จึงเป็นที่มาของธุรกิจใหม่ในรอบ 10 ปี 15 ปีที่ผ่านมา จะเห็นได้จากธุรกิจขายตรงอย่างแอมเวย์ที่ใช้กลยุทธ์แบบนี้ คือ ถ้าผมขายสินค้าให้คุณใช้ แล้วคุณใช้ผลิตภัณฑ์ของผมแล้วคุณชอบ ทำไมคุณไม่แนะนำเพื่อนของคุณอีก 10 คนให้ใช้ล่ะ คุณก็จะได้รับส่วนลดด้วย คุณได้กำไรด้วย เผลอๆ เท่ากับได้ใช้ฟรี หรือเผลอๆ คุณจะได้กำไรอีกด้วย วิธีที่ดีที่สุดในการสร้างความสัมพันธ์ลูกค้า ก็คือ เมื่อคุณสร้างความสัมพันธ์กับลูกค้า สร้างพวกเขาจนทำให้เขากลายเป็นพนักงานขายของคุณแล้ว และเป็นคนแนะนำให้คนมาซื้อสินค้าคุณ นั่นเป็นวิธีที่ดีที่สุด คุณต้องสร้างฐานลูกค้า (Customer Base) โดยการพยายามที่จะเข้าถึงลูกค้าในทุกจุดที่สามารถติดต่อกับลูกค้าได้ ไม่ว่าจะเป็น Call Center, หรือการบริการหลังการขาย หรือแผนกบัญชี ถ้าคุณสามารถเก็บข้อมูลนั้นแล้วสร้างฐานข้อมูล ขึ้นมา คุณก็จะมีโอกาสเติบโต มีโอกาสที่จะเก็บลูกค้ากลุ่มนั้นๆ ให้อยู่กับคุณนานที่สุดและขณะเดียวกัน ก็มีลูกค้าเพิ่มขึ้น ลูกค้าที่จะนำผลกำไร (Profitable Customer) มาให้คุณในที่สุด
tee [31 พ.ค. 2550 , 05:31 PM]
ต้องการทำเว็ปที่เอาไว้เก็บเอกสารโดยจะเก็บเอกสารเป็นหมวดหมู่ แต่ตอนsaveแต่ละเอกสาร ต้องให้มันรู้เองว่ามันจะต้องไปอยู่ในหมวดหมู่ไหน(ต้องใช้ AI) อยากทราบว่าจะมีวิธีการทำอย่างไรบ้างค่ะ หรือต้องเริ่มจากตรงไหนก่อนค่ะ ช่วยแนะนำหน่อยค่ะ ขอบคุณค่ะ [email protected]
เล็ก [02 มิ.ย. 2550 , 03:20 PM]
หาก คุณมี ข้อสงสัย เรื่อง data mining แต่ก่อนอื่นคุณควรรู้พื้น ฐาน มาคราวๆ ก่อน นะ และเมื่อรู้แล้ว ยังไม่เข้าใจ เช่น ถ้า มีข้อมูลแบบ นี้ จะทำ data mining ได้หรือ ไม่ ? จะเลือกวิธีไหน ในการ ทำ data mining ? data mining เหมาะ กับ อะไร ? ถ้า อยากจะพัฒนา data mining Softwre ขึ้นใช้เอง หรือ ใน องค์ กร มี คำตอบให้คุณที่ [email protected]
luxifer [14 ก.ค. 2550 , 03:23 PM]
ขอขอมูลของเกี่ยวกับอัลกอริทึ่มหน่อยสิครับการวิเคราะห์ขั้นจตอนการทำงานความหมายการทำงานเกี่ยวกับอัลกอริทึ่มสูตรต่างๆ
ถึงอิ๊บ [17 มิ.ย. 2551 , 01:58 AM]
ถามมาอย่างงี้ใครเข้าจะส่งให้ครับ ไม่มีความรู้พื้นฐานเลย ถามอย่างเดียวคงมีคนตอบให้คุณหรอกครับ
ppp [29 ก.ค. 2551 , 09:14 AM]
อยากจะทำโปรเจคจบเกี่ยวกับ data mining ซึ่งในขณะนี้มีข้อมูลของเกษตรกรในหนึ่งอำเภอ (เช่น รายชื่อเกษตรกร ชนิดพืชที่ปลูก ผลผลิต เป็นต้น) อยากจะขอแนะนำว่าควรจะทำ data mining ข้อมูลเหล่านี้ด้านใดและใช้ทฤษฎีใด
por [10 ธ.ค. 2554 , 04:09 PM]
กำลังทำโปรเจคจบ คล้ายกับ คุณ ppp แต่หนูใช้นิวรอลเน็ต ตอนนี้ติดปัญหาที่สุ่มค่าน้ำหนักเริ่มต้น และค่าไบแอส ค่ะ และนำไปเขียนโปรแกรม รบกวนช่วยแนะนำด้วยนะคะ