-
มาวิเคราะห์ Market Basket Analysis กัน

ครั้งนี้มาลองทำ Market Basket Analysis (MBA) เป็นเทคนิคที่สำคัญสำหรับ Data Analyst ในการค้นหาความสัมพันธ์ของสินค้าเพื่อวางแผนโปรโมชั่นขายแพ็คคู่ 🛍️ หรืออื่นๆ ในทำนองเดียวกัน เช่น การจัดชั้นวางของในห้างสรรพสินค้า ว่าจะวางอะไรไว้ใกล้กับอะไรดี, หรือใน online shopping อาจจะใช้ในเรื่องการแนะนำสินค้าอะไรต่อไปให้ลูกค้าดี และหัวใจหลักของ MBA คือการค้นหา กฎ ที่อยู่ในรูปแบบ A→B ซึ่งหมายความว่า “ถ้าลูกค้าซื้อสินค้า A แล้ว (Antecedent) ลูกค้ามีแนวโน้มที่จะซื้อสินค้า B ด้วย (Consequent)” ในภาษา R (ครั้งนี้) เราจะใช้แพ็กเกจ arules และอัลกอริทึม Apriori เป็นหลัก โดยเริ่มจาก transaction เลย ว่าเริ่มจัดการยังไง คำนวณผลลัพธ์ยังไง และจบยังไง. การเตรียมข้อมูล (Data Preparation) มาดูหน้าตาของตาราง transaction การขายสินค้าในแต่ละวันกันก่อน ซึ่งมีหลากลายรูปแบบเลยในการเก็บข้อมูลของแต่ละร้าน…
-
AB Testing With R

ครั้งนี้จะมาลองทำ A/B Testing ตาม 2 ท่านนี้ Mobile Games A/B Testing และ A/B Testing: Step by Step & Hypothesis Testing แน่นอนว่าผลลัพธ์หรือวิธีการคิดอาจจะเหมือนหรือแตกต่างกันออกไป จากตัวอย่างเค้าใช้ python แต่เราจะใช้ภาษา R กันบ้าง หลังจากที่วิเคราะห์โดยใช้ python กันไปแล้วในโพสต์นี้ “มาทำ AB Testing ใน python กัน” นะครับ Cookie Cats เป็นเกมที่เป็นที่นิยม ถูกพัฒนาโดย Tactile Entertainment เป็น puzzle game ที่ใช้การลากเชื่อมต่อบล็อกสีเดียวกันให้ได้แต้มมากที่สุดเพื่อชนะและผ่านด่านเลเวล มีแมวเป็นตัวละครหลัก เมื่อเล่นเกมไปเรื่อยๆ จะเจอกับ gate ที่บังคับให้ผู้เล่นต้องรอสักพักก่อนที่จะสามารถเล่นต่อหรือซื้อสินค้าภายในแอปได้ นอกจากจะกระตุ้นให้เกิดการซื้อของในแอปแล้ว gate เหล่านี้ยังมีจุดประสงค์สำคัญในการบังคับให้ผู้เล่นหยุดพักจากการเล่นเกม ซึ่งหวังว่าจะทำให้ผู้เล่นสนุกกับเกมมากขึ้น และยาวนานขึ้น แต่ gate ควรวางไว้ตรงไหน? เดิมที…
-
LLog EP03: การนำเสนอจำนวนและสัดส่วน

ในการรายงานผลสถิติต่างๆ ในสื่อ หรือในรายงาน อาจจะพบว่า event หนึ่งๆ ว่าจะเกิดขึ้นหรือไม่เป็นอัตรา เป็นเปอร์เซ็นต์ เป็นร้อยละ อย่างเช่น “อัตราการเสียชีวิตของเด็กที่ได้รับการผ่าตัดหัวใจอยู่ที่ 5 เปอร์เซ็นต์” แต่ว่าตัวเลขที่เขารายงานมานั้น มันน่าเชื่อถือแค่ไหน หรือมันโดน context รอบข้างทำให้เราอคติในข้อความนั้นกันนะ EP นี้เลยจะพามาลองทำความเข้าใจกันดูครับ ตารางแสดงผลการผ่าตัดหัวใจของเด็กเกือบ 13,000 ราย ในสหราชอาณาจักรและไอร์แลนด์ระหว่างปี 2012-2015 ทารก 263 ราย เสียชีวิตภายใน 30 วันหลังผ่าตัด (เป็นโศกนาฎกรรมในครอบครัว) แม้อัตราการรอดชีวิตจะสูงเท่ากับ 98% ก็ตาม สรุปใน EP นี้
-
LLog EP02: PPDAC กรอบแนวคิด ที่จะช่วยแก้ปัญหาต่างๆ ด้วย Data

มาต่อ EP02 กันครับ การจะได้มีซึ่งค่าสถิติที่ถูกต้อง แม่นยำ ต้องมาจากการกำหนดนิยามของสิ่งที่เราจะศึกษาให้ชัดเจนก่อน ทั้งยังที่ข้อคำนึงไว้อีกว่า ผลสถิติจากกลุ่มตัวอย่างไม่สามารถนำไปใช้สรุปผลกับประชากรทั้งหมดได้อย่างสมบูรณ์ เป็นเพียงการประมาณค่า (estimation) เท่านั้น ครั้งนี้เลยมาต่อที่กระบวนการ (process) ที่เป็นขั้นตอนเพื่อให้เราสามารถนำหลักการทางสถิติไปใช้ในสถานการณ์จริงได้อย่างเป็นระบบและมีประสิทธิภาพมากขึ้น ในหนังสือได้นำเสนอวงจร PPDAC —The Data Problem Solving Cycle กรอบแนวคิด ที่จะช่วยแก้ปัญหาต่างๆ ด้วย Data ซึ่งหลักการทางสถิติที่ว่า “การศึกษาที่เราพยายามจะเข้าใจโลก ผ่านการเรียนรู้จากกลุ่มตัวอย่าง เพื่อที่จะสรุปผลค่าต่างๆ (estimation) กลับไปหาประชากรทั้งหมดได้ โดยมีเป้าหมายที่จะ make better decisions” นั้น เป็นแนวทางที่สอดคล้องกับ PPDAC Framework อย่างมาก เหมือนกรอบการทำงานที่นำเอาหลักการทางสถิติมาประยุกต์ใช้ในกระบวนการแก้ปัญหาอย่างเป็นระบบ PPDAC ย่อมาจาก (Problem-Plan-Data-Analysis-Conclusion) โดยที่: สรุปใน EP นี้
-
LLog EP01: The art of statistics

สวัสดีครับ วันนี้จะมาแชร์ความรู้ ความเข้าใจที่ได้จากอ่านหนังสือ “The art of statistics learning from data” ของ David Spiegelhalter เล่มแปลโดยคุณสุนันทา วรรณสิทธ์ แน่นอนว่าบวกกับความเข้าใจของแอดเองเข้าไปด้วย (ความเข้าใจในปี 2025 ณ วันที่อ่าน) —ซึ่งจะขอแบ่งเป็นตอนๆ ไปนะครับ อ่านทั้งเล่มไม่ทันจริงๆ ค่อยๆ มาปล่อยแล้วกัน เป็นยังไงบ้างไปดูกันเลย คำถามตัวอย่าง: ในโลกนี้มี “ต้นไม้” ทั้งหมดกี่ต้น? สรุปใน EP นี้
-
มาทำ AB Testing ใน python กัน

การทดลอง (Experimentation) เป็นวิธีการสำคัญในยุค Digital marketing ปัจจุบันอย่างมากกเลย รู้มั้ยครับว่า..เพลย์ลิสต์ของ Spotify, ปุ่มหยิบใส่ตะกร้าของ Shopee, ข้อความบนปุ่มกดตอนจะซื้อประกัน, การแสดงราคาสินค้าในเว็บ e-commerce ต่างๆ ในความจริงแล้วไม่ได้เกิดจากนักพัฒนาเว็บ อยากจะวางปุ่ม วางราคา วางส่วนลดที่ตำแหน่งไหนยังไงก็ได้ หรือวันหนึ่งตื่นขึ้นมาแล้วมาไอเดียก็เขียนเพิ่มแล้ววางองค์ประกอบนั้นเข้าไปในเว็บได้อย่างนั้นเลย ทุกการกระทำ หรือการเปลี่ยนแปลงของระบบ โปรแกรม แอพพลิเคชั่นในยุคนี้ล้วนผ่านการทดลอง ทดสอบมาอย่างละเอียดแล้วเท่านั้น เพราะเป้าหมายในการเปลี่ยนคือทำยังไงให้รักษาความสนใจของลูกค้าผู้ใช้งานไว้ได้ และดึงผู้ใช้อย่างเราๆ อยู่บนแพลตฟอร์มของเค้าไปนานๆ นั่นเอง A/B Testing จึงมีบทบาทสำคัญในการทำทดสอบนี้ เพราะมันทำให้เราไม่ต้องมานั่งตัดสินใจว่าโฆษณาตัวใด แคมเปญตัวไหน ที่ลูกค้าเห็นแล้วจะคลิกเข้ามาดู กดสั่งซื้อได้มากที่สุด เพราะบางครั้งมนุษย์อาจจะใช้ ้ “อารมณ์ความรู้สึก” ตอนนั้นเองเป็นตัวตัดสินใจก็ได้ ซึ่งมันไม่ได้ช่วยให้เกิดผลดีต่อธุรกิจ เพราะอย่างนั้นการทดสอบอย่าง A/B Testing จึงเป็นตัวช่วยในเรื่องลด bias การตัดสินใจเลือกของบุคคลได้ (ก็คือให้กลุ่มทดลองมาช่วยตัดสินใจแทน) ในโพสต์นี้หนุ่มก็เลยจะพามาลองใช้ python ทำ A/B Testing กันนะฮะ สุดท้ายแล้วคุณผู้อ่านอาจจะเข้าใจ (หรืองงหนักกว่าเดิม) ในเรื่องของ A/B…
-
Logistic Regression ทำนายการเกิดโรคเบาหวาน

ได้ฤกษ์เปิด mini project ใหม่ขึ้นมาอีกซักหนึ่ง ฮ่าๆๆ วันนี้เป็น Logistic Regression Model โดยใช้ชุดข้อมูล diabetes จาก Kaggle ภาพรวมเป็น Dataset ของผู้หญิงชนเผ่า Pima Indians มีอัตราการเกิดโรคเบาหวานประเภท 2 สูงที่สุดแห่งหนึ่งในโลก ไม่ว่าจะเป็นวิถีชีวิต การบริโภคอาหารที่มีไขมันและน้ำตาลสูงขึ้น และการออกกำลังกายน้อยลง มีส่วนทำให้ความชุกของโรคเบาหวานเพิ่มขึ้น ใน dataset: diabetes.csv มีทั้งหมด 768 แถว และ 9 คอลัมน์ มีรายละเอียด Data Dictionary ดังนี้ Features ใน dataset ความหมาย Pregnancies จำนวนครั้งที่ตั้งครรภ์ Glucose ระดับน้ำตาล (กลูโคส) ในเลือด (mg/dL) BloodPressure ค่าความดันโลหิต (mmHg) SkinThickness ความหนาของรอยพับผิวหนัง triceps…
-
พาลง Titanic ด้วย Logistic Regression

สวัสดีคุณผู้อ่านทุกท่านค้าบ 😆 ฮี่ๆ วันนี้พามาใช้ R ในการทำโมเดล Logistic regression กันฮะ โดยใช้ข้อมูลที่ Data Analyst น่าจะเคยผ่านหูผ่านตากันมาบ้างสักครั้งนึง เพราะ “ถ้าคุณโดด ผมโดด” 😭 และสุดท้ายหนุ่มต้องการจะสร้าง App เพื่อ Role play เป็นคนในเรือดูว่าจะรอด ไม่จม ไม่แข็งตายไปรึป่าว กดไล่ดูตามหัวข้อได้เลยคับ 🤝 รู้จักข้อมูลกันก่อน🥘 Prep ข้อมูลให้พร้อมใช้ในโมเดล🚂 Train Model: พี่จะสอนน้องเอง🧪 Test Model: ลองดูก่อน🍌มา Role play แบบเรียลไทม์กัน 🤝 รู้จักข้อมูลกันก่อน Data set นี้มาจาก library(titanic) ของ R มีเรคคอร์ดทั้งหมด 891 rows เป็น 891 คนที่ได้ขึ้นเรือไทนานิคและเก็บข้อมูลมาได้ (มั้งง?) Columns…
-
ไปเก็บข้อมูล Pokémon ลง Pokédex ด้วย R กัน

หลังจากที่ได้เรียน Web Scraping 💻 ในคลาสเรียน R มาแล้ว วันนี้หนุ่มจะพาไปเก็บข้อมูล Pokémon จากหน้าเว็บ Static website ด้วยภาษา R กัน ต่อเนื่องจากบทความ ทำรายงานสถิติประจำเดือนง่ายๆ ด้วยภาษา R ก่อนหน้านี้ โดยหนุ่มจะใช้หน้าเว็บ List of Pokémon | Pokémon Wiki | Fandom นี้ ในการดึงข้อมูลออกมา ดาวน์โหลดรูปเก็บไว้ในเครื่อง และโหลดข้อมูลลง Google sheet ดูน้า พร้อมแล้วไปกันเลย List of contents Load library เบื้องต้นหนุ่มจะเรียกใช้ library พื้นฐาน 3 ตัวนะครับ Extract text from <table> tag จากที่บอกไปข้างต้นว่าหนุ่มจะใช้เว็บของ Fandom ในการดึงนะครับ…
-
ทำรายงานสถิติประจำเดือนง่ายๆ ด้วยภาษา R

หลังจากที่ได้ลองใช้ Python ทำรายงานมาแล้ว คราวนี้ก็มาลองใช้ R ในการทำรายงานดูบ้างครับ เพราะหนุ่มเชื่อว่าแค่การเรียนอย่างเดียว มันจำไม่ได้หรอก ต้องเรียนจากประสบการณ์ และการใช้งานกับสถานการณ์จริงด้วย 😎 ครั้งนี้มาพร้อมกับโจทย์ที่ว่า “จำนวนผู้ป่วยทั้งหมดที่รับไว้ในหอผู้ป่วยในและอัตราการครองเตียงเดือนนี้เป็นเท่าใด? เพิ่มขึ้นหรือลดลงแค่ไหนเมื่อเทียบกับเดือนที่แล้ว” สร้างกราฟ และตารางตัวเลขให้พี่ด้วย หลังจากที่ไปดีลกับทีม DE รบกวนดึงข้อมูลให้หน่อยค้าบบ ได้ไฟล์มาแล้วก็มาเริ่มกันเลย ✌️ Import data เกริ่นไว้ก่อนนะครับ ข้อมูลที่ใช้แสดงตัดมาใช้แค่สองเดือนนะครับเป็นข้อมูลผู้ป่วยใน (In-patient Department: IPD) ของโรงพยาบาลและเข้ารหัส (Encode) ไว้แล้วน้า .. โอเค เริ่ม ใช้ Library readxl ในการอ่านไฟล์ Excel ที่ได้มาจากทีม DE ใช้ทั้งหมด 3 ชีท Data exploratory analysis มาสำรวจดูข้อมูลกันก่อน 🔍 แต่ละชีทมีข้อมูลเป็นยังไงมั้ง a. Raw Data ipd มีประมาณ…
Search
About
Feasible เว็บไซต์ที่นำเสนออาชีพปัจจุบันที่เรา (เจ้าของเว็บ) กำลังทำ ไม่ว่าจะเป็น นักวิเคราะห์ข้อมูล นักเรียน นักอ่าน นักฟาร์ม และอีกหลากหลายมุมมอง เรียกได้ว่าเป็น ‘แกงโฮะ’ เลยล่ะ ฮ่าๆๆ ติดตาม Content ที่จะทำออกมาได้เรื่อยๆ นะครับ ขอบคุณที่เข้ามาเยี่ยมกัน 😁✌️





