• LLog EP03: การนำเสนอจำนวนและสัดส่วน

    LLog EP03: การนำเสนอจำนวนและสัดส่วน

    ในการรายงานผลสถิติต่างๆ ในสื่อ หรือในรายงาน อาจจะพบว่า event หนึ่งๆ ว่าจะเกิดขึ้นหรือไม่เป็นอัตรา เป็นเปอร์เซ็นต์ เป็นร้อยละ อย่างเช่น “อัตราการเสียชีวิตของเด็กที่ได้รับการผ่าตัดหัวใจอยู่ที่ 5 เปอร์เซ็นต์” แต่ว่าตัวเลขที่เขารายงานมานั้น มันน่าเชื่อถือแค่ไหน หรือมันโดน context รอบข้างทำให้เราอคติในข้อความนั้นกันนะ EP นี้เลยจะพามาลองทำความเข้าใจกันดูครับ ตารางแสดงผลการผ่าตัดหัวใจของเด็กเกือบ 13,000 ราย ในสหราชอาณาจักรและไอร์แลนด์ระหว่างปี 2012-2015 ทารก 263 ราย เสียชีวิตภายใน 30 วันหลังผ่าตัด (เป็นโศกนาฎกรรมในครอบครัว) แม้อัตราการรอดชีวิตจะสูงเท่ากับ 98% ก็ตาม สรุปใน EP นี้

    Continue Reading

  • LLog EP02: PPDAC กรอบแนวคิด ที่จะช่วยแก้ปัญหาต่างๆ ด้วย Data

    LLog EP02: PPDAC กรอบแนวคิด ที่จะช่วยแก้ปัญหาต่างๆ ด้วย Data

    มาต่อ EP02 กันครับ การจะได้มีซึ่งค่าสถิติที่ถูกต้อง แม่นยำ ต้องมาจากการกำหนดนิยามของสิ่งที่เราจะศึกษาให้ชัดเจนก่อน ทั้งยังที่ข้อคำนึงไว้อีกว่า ผลสถิติจากกลุ่มตัวอย่างไม่สามารถนำไปใช้สรุปผลกับประชากรทั้งหมดได้อย่างสมบูรณ์ เป็นเพียงการประมาณค่า (estimation) เท่านั้น ครั้งนี้เลยมาต่อที่กระบวนการ (process) ที่เป็นขั้นตอนเพื่อให้เราสามารถนำหลักการทางสถิติไปใช้ในสถานการณ์จริงได้อย่างเป็นระบบและมีประสิทธิภาพมากขึ้น ในหนังสือได้นำเสนอวงจร PPDAC —The Data Problem Solving Cycle กรอบแนวคิด ที่จะช่วยแก้ปัญหาต่างๆ ด้วย Data ซึ่งหลักการทางสถิติที่ว่า “การศึกษาที่เราพยายามจะเข้าใจโลก ผ่านการเรียนรู้จากกลุ่มตัวอย่าง เพื่อที่จะสรุปผลค่าต่างๆ (estimation) กลับไปหาประชากรทั้งหมดได้ โดยมีเป้าหมายที่จะ make better decisions” นั้น เป็นแนวทางที่สอดคล้องกับ PPDAC Framework อย่างมาก เหมือนกรอบการทำงานที่นำเอาหลักการทางสถิติมาประยุกต์ใช้ในกระบวนการแก้ปัญหาอย่างเป็นระบบ PPDAC ย่อมาจาก (Problem-Plan-Data-Analysis-Conclusion) โดยที่: สรุปใน EP นี้

    Continue Reading

  • LLog EP01: The art of statistics

    LLog EP01: The art of statistics

    สวัสดีครับ วันนี้จะมาแชร์ความรู้ ความเข้าใจที่ได้จากอ่านหนังสือ “The art of statistics learning from data” ของ David Spiegelhalter เล่มแปลโดยคุณสุนันทา วรรณสิทธ์ แน่นอนว่าบวกกับความเข้าใจของแอดเองเข้าไปด้วย (ความเข้าใจในปี 2025 ณ วันที่อ่าน) —ซึ่งจะขอแบ่งเป็นตอนๆ ไปนะครับ อ่านทั้งเล่มไม่ทันจริงๆ ค่อยๆ มาปล่อยแล้วกัน เป็นยังไงบ้างไปดูกันเลย คำถามตัวอย่าง: ในโลกนี้มี “ต้นไม้” ทั้งหมดกี่ต้น? สรุปใน EP นี้

    Continue Reading

  • มาทำ AB Testing ใน python กัน

    มาทำ AB Testing ใน python กัน

    การทดลอง (Experimentation) เป็นวิธีการสำคัญในยุค Digital marketing ปัจจุบันอย่างมากกเลย รู้มั้ยครับว่า..เพลย์ลิสต์ของ Spotify, ปุ่มหยิบใส่ตะกร้าของ Shopee, ข้อความบนปุ่มกดตอนจะซื้อประกัน, การแสดงราคาสินค้าในเว็บ e-commerce ต่างๆ ในความจริงแล้วไม่ได้เกิดจากนักพัฒนาเว็บ อยากจะวางปุ่ม วางราคา วางส่วนลดที่ตำแหน่งไหนยังไงก็ได้ หรือวันหนึ่งตื่นขึ้นมาแล้วมาไอเดียก็เขียนเพิ่มแล้ววางองค์ประกอบนั้นเข้าไปในเว็บได้อย่างนั้นเลย ทุกการกระทำ หรือการเปลี่ยนแปลงของระบบ โปรแกรม แอพพลิเคชั่นในยุคนี้ล้วนผ่านการทดลอง ทดสอบมาอย่างละเอียดแล้วเท่านั้น เพราะเป้าหมายในการเปลี่ยนคือทำยังไงให้รักษาความสนใจของลูกค้าผู้ใช้งานไว้ได้ และดึงผู้ใช้อย่างเราๆ อยู่บนแพลตฟอร์มของเค้าไปนานๆ นั่นเอง A/B Testing จึงมีบทบาทสำคัญในการทำทดสอบนี้ เพราะมันทำให้เราไม่ต้องมานั่งตัดสินใจว่าโฆษณาตัวใด แคมเปญตัวไหน ที่ลูกค้าเห็นแล้วจะคลิกเข้ามาดู กดสั่งซื้อได้มากที่สุด เพราะบางครั้งมนุษย์อาจจะใช้ ้ “อารมณ์ความรู้สึก” ตอนนั้นเองเป็นตัวตัดสินใจก็ได้ ซึ่งมันไม่ได้ช่วยให้เกิดผลดีต่อธุรกิจ เพราะอย่างนั้นการทดสอบอย่าง A/B Testing จึงเป็นตัวช่วยในเรื่องลด bias การตัดสินใจเลือกของบุคคลได้ (ก็คือให้กลุ่มทดลองมาช่วยตัดสินใจแทน) ในโพสต์นี้หนุ่มก็เลยจะพามาลองใช้ python ทำ A/B Testing กันนะฮะ สุดท้ายแล้วคุณผู้อ่านอาจจะเข้าใจ (หรืองงหนักกว่าเดิม) ในเรื่องของ A/B…

    Continue Reading

  • Logistic Regression ทำนายการเกิดโรคเบาหวาน

    Logistic Regression ทำนายการเกิดโรคเบาหวาน

    ได้ฤกษ์เปิด mini project ใหม่ขึ้นมาอีกซักหนึ่ง ฮ่าๆๆ วันนี้เป็น Logistic Regression Model โดยใช้ชุดข้อมูล diabetes จาก Kaggle ภาพรวมเป็น Dataset ของผู้หญิงชนเผ่า Pima Indians มีอัตราการเกิดโรคเบาหวานประเภท 2 สูงที่สุดแห่งหนึ่งในโลก ไม่ว่าจะเป็นวิถีชีวิต การบริโภคอาหารที่มีไขมันและน้ำตาลสูงขึ้น และการออกกำลังกายน้อยลง มีส่วนทำให้ความชุกของโรคเบาหวานเพิ่มขึ้น ใน dataset: diabetes.csv มีทั้งหมด 768 แถว และ 9 คอลัมน์ มีรายละเอียด Data Dictionary ดังนี้ Features ใน dataset ความหมาย Pregnancies จำนวนครั้งที่ตั้งครรภ์ Glucose ระดับน้ำตาล (กลูโคส) ในเลือด (mg/dL) BloodPressure ค่าความดันโลหิต (mmHg) SkinThickness ความหนาของรอยพับผิวหนัง triceps…

    Continue Reading

  • พาลง Titanic ด้วย Logistic Regression

    พาลง Titanic ด้วย Logistic Regression

    สวัสดีคุณผู้อ่านทุกท่านค้าบ 😆 ฮี่ๆ วันนี้พามาใช้ R ในการทำโมเดล Logistic regression กันฮะ โดยใช้ข้อมูลที่ Data Analyst น่าจะเคยผ่านหูผ่านตากันมาบ้างสักครั้งนึง เพราะ “ถ้าคุณโดด ผมโดด” 😭 และสุดท้ายหนุ่มต้องการจะสร้าง App เพื่อ Role play เป็นคนในเรือดูว่าจะรอด ไม่จม ไม่แข็งตายไปรึป่าว กดไล่ดูตามหัวข้อได้เลยคับ 🤝 รู้จักข้อมูลกันก่อน🥘 Prep ข้อมูลให้พร้อมใช้ในโมเดล🚂 Train Model: พี่จะสอนน้องเอง🧪 Test Model: ลองดูก่อน🍌มา Role play แบบเรียลไทม์กัน 🤝 รู้จักข้อมูลกันก่อน Data set นี้มาจาก library(titanic) ของ R มีเรคคอร์ดทั้งหมด 891 rows เป็น 891 คนที่ได้ขึ้นเรือไทนานิคและเก็บข้อมูลมาได้ (มั้งง?) Columns…

    Continue Reading

  • ไปเก็บข้อมูล Pokémon ลง Pokédex ด้วย R กัน

    ไปเก็บข้อมูล Pokémon ลง Pokédex ด้วย R กัน

    หลังจากที่ได้เรียน Web Scraping 💻 ในคลาสเรียน R มาแล้ว วันนี้หนุ่มจะพาไปเก็บข้อมูล Pokémon จากหน้าเว็บ Static website ด้วยภาษา R กัน ต่อเนื่องจากบทความ ทำรายงานสถิติประจำเดือนง่ายๆ ด้วยภาษา R ก่อนหน้านี้ โดยหนุ่มจะใช้หน้าเว็บ List of Pokémon | Pokémon Wiki | Fandom นี้ ในการดึงข้อมูลออกมา ดาวน์โหลดรูปเก็บไว้ในเครื่อง และโหลดข้อมูลลง Google sheet ดูน้า พร้อมแล้วไปกันเลย List of contents Load library เบื้องต้นหนุ่มจะเรียกใช้ library พื้นฐาน 3 ตัวนะครับ Extract text from <table> tag จากที่บอกไปข้างต้นว่าหนุ่มจะใช้เว็บของ Fandom ในการดึงนะครับ…

    Continue Reading

  • ทำรายงานสถิติประจำเดือนง่ายๆ ด้วยภาษา R

    ทำรายงานสถิติประจำเดือนง่ายๆ ด้วยภาษา R

    หลังจากที่ได้ลองใช้ Python ทำรายงานมาแล้ว คราวนี้ก็มาลองใช้ R ในการทำรายงานดูบ้างครับ เพราะหนุ่มเชื่อว่าแค่การเรียนอย่างเดียว มันจำไม่ได้หรอก ต้องเรียนจากประสบการณ์ และการใช้งานกับสถานการณ์จริงด้วย 😎 ครั้งนี้มาพร้อมกับโจทย์ที่ว่า “จำนวนผู้ป่วยทั้งหมดที่รับไว้ในหอผู้ป่วยในและอัตราการครองเตียงเดือนนี้เป็นเท่าใด? เพิ่มขึ้นหรือลดลงแค่ไหนเมื่อเทียบกับเดือนที่แล้ว” สร้างกราฟ และตารางตัวเลขให้พี่ด้วย หลังจากที่ไปดีลกับทีม DE รบกวนดึงข้อมูลให้หน่อยค้าบบ ได้ไฟล์มาแล้วก็มาเริ่มกันเลย ✌️ Import data เกริ่นไว้ก่อนนะครับ ข้อมูลที่ใช้แสดงตัดมาใช้แค่สองเดือนนะครับเป็นข้อมูลผู้ป่วยใน (In-patient Department: IPD) ของโรงพยาบาลและเข้ารหัส (Encode) ไว้แล้วน้า .. โอเค เริ่ม ใช้ Library readxl ในการอ่านไฟล์ Excel ที่ได้มาจากทีม DE ใช้ทั้งหมด 3 ชีท Data exploratory analysis มาสำรวจดูข้อมูลกันก่อน 🔍 แต่ละชีทมีข้อมูลเป็นยังไงมั้ง a. Raw Data ipd มีประมาณ…

    Continue Reading

  • วิเคราะห์ความรู้สึกของลูกค้าจากคอมเมนต์ใน TikTok ด้วย python

    วิเคราะห์ความรู้สึกของลูกค้าจากคอมเมนต์ใน TikTok ด้วย python

    หลังจากที่เกริ่นไว้นานแล้วว่าจะเขียน post เกี่ยวกับ python บ้าง มาด้วยหัวข้อแรก ก็เริ่มจากวิเคราะห์ความรู้สึกของลูกค้าเลย disclaimer กันก่อนอันนี้เป็นโปรเจ็คลองทำนะครับ โค้ดอาจจะยึดยาวซักหน่อย จะได้เห็นที่มาที่ไปครับ เป็นยังไงไปดูกัน จากแนวคิดที่ได้ไปอบรมมา หนุ่มได้เรียน Web scrapping ทั้งที่เป็น Static และ Dynamic ในคอร์สอบรม Geeks ของกรมควบคุมโรค (ป้ายยาของเค้าดีจริงๆ) และก็ได้ลองทำตามบทความ >>link<< ของ อ.ดร.กานต์ ม.รังสิต ในการวิเคราะห์ความรู้สึกของลูกค้าที่คอมเมนต์เข้ามา หนุ่มก็เลยรวบองค์ความรู้ 2 อันนี้มาประกอบกันดู ซึ่งแบ่งออกเป็น 5 ขั้นตอนหลัก ดังนี้ Library เป็นโปรเจ็คที่ค่อนข้างเรียกใช้ Library ที่เยอะมากเหมือนกันนะเนี่ย หลักๆ ก็จะเป็น BeautifulSoup, Selenium, Regex, Altair, … มากมายค่อยๆ บอกว่าใช้ทำอะไรในขั้นต่อไปแล้วกันนะครับ —สำหรับ Library ไหนที่เครื่องท่านผู้อ่านยังไม่มี ให้ pip…

    Continue Reading

  • [SQL] อยากรู้อันดับไหนล่ะ? เมื่อมากที่สุดอันดับ 2 ไม่พอ

    [SQL] อยากรู้อันดับไหนล่ะ? เมื่อมากที่สุดอันดับ 2 ไม่พอ

    เปิด LeetCode มาฝึกสมองกันอีกแล้ว คราวนี้ไม่ได้อยากรู้แค่มากที่สุดอันดับ 2 (ตามโพสต์ก่อนหน้านี้: link) ต้องการความ dynamic มากขึ้น อันดับไหนก็ได้ถ้าชั้นอยากรู้ เจ้าทาสทั้งหลายจงไปหาคำตอบมาให้ข้า .. ฮ่าๆๆ งั้นคงต้องเขียนเป็นฟังก์ชันแล้วล่ะ โอเคเริ่ม Table: Table: Employee Write a solution to find the nth highest salary from the Employee table. If there is no nth highest salary, return null. จงหา เงินเดือนที่สูงที่สุดตามอันดับที่ระบุ (nth) จากตารางทาส ถ้าไม่มีอันดับที่ต้องการส่ง null กลับมาจ้า The result format is in the following…

    Continue Reading

Search

About

Feasible เว็บไซต์ที่นำเสนออาชีพปัจจุบันที่เรา (เจ้าของเว็บ) กำลังทำ ไม่ว่าจะเป็น นักวิเคราะห์ข้อมูล นักเรียน นักอ่าน นักฟาร์ม และอีกหลากหลายมุมมอง เรียกได้ว่าเป็น ‘แกงโฮะ’ เลยล่ะ ฮ่าๆๆ ติดตาม Content ที่จะทำออกมาได้เรื่อยๆ นะครับ ขอบคุณที่เข้ามาเยี่ยมกัน 😁✌️

Social Icons

Buy Me a Coffee

😁 ขอบคุณทุกน้ำใจ ทุกการสนับสนุนครับ 👏