• 4 ข้อดีๆ ของ Module CSV

    4 ข้อดีๆ ของ Module CSV

    ไฟล์ csv ไฟล์เก็บข้อมูลแบบเบสิคง่ายๆ ที่เราใช้แลกเปลี่ยนข้อมูลกันไปมานั้น ลองมาดูกันว่าเมื่อมันทำงานคู่กับโค้ด python แล้วมันจะเจ๋งแจ๋วสักแค่ไหนกัน csv หรือ comma-separated values แน่นอนเป็นไฟล์ที่ใช้เก็บข้อมูลประเภทตาราง แต่ละ row (บรรทัด) แสดงถึงข้อมูลแต่ละรายการ โดยใช้เครื่องหมาย , (comma) เป็นตัวคั่นแต่ละคอลัมน์ออกจากกัน มั่นใจว่าคุณผู้ป่านทุกท่านน่าจะเคยผ่านหูผ่านตา เคยใช้งานกับไฟล์ชนิดนี้มากันแล้วอย่างน้อยซักครั้ง ยิ่งท่านใดที่ใช้ python น่าจะเคย load data มันขึ้นมา process กันบ้างแหละเน๊อะ ตัวอย่าง เราได้ทำการอ่านไฟล์ csv: Social Sentiment Data ที่ได้มาจาก Kaggle และอ่านมันออกมาทุกคอลัมน์เลย จะได้ผลลัพธ์ออกมาเป็นแบบนี้ แล้ว Module csv ที่ว่าดีมันเป็นยังไง: 1. มัน Detect ตัวคั่น delimiter จากไฟล์ได้ โดยปกติแล้วไฟล์ csv ถูกออกแบบมาใช้ , (comma)

    Continue Reading

  • มาทำ AB Testing ใน python กัน

    มาทำ AB Testing ใน python กัน

    การทดลอง (Experimentation) เป็นวิธีการสำคัญในยุค Digital marketing ปัจจุบันอย่างมากกเลย รู้มั้ยครับว่า..เพลย์ลิสต์ของ Spotify, ปุ่มหยิบใส่ตะกร้าของ Shopee, ข้อความบนปุ่มกดตอนจะซื้อประกัน, การแสดงราคาสินค้าในเว็บ e-commerce ต่างๆ ในความจริงแล้วไม่ได้เกิดจากนักพัฒนาเว็บ อยากจะวางปุ่ม วางราคา วางส่วนลดที่ตำแหน่งไหนยังไงก็ได้ หรือวันหนึ่งตื่นขึ้นมาแล้วมาไอเดียก็เขียนเพิ่มแล้ววางองค์ประกอบนั้นเข้าไปในเว็บได้อย่างนั้นเลย ทุกการกระทำ หรือการเปลี่ยนแปลงของระบบ โปรแกรม แอพพลิเคชั่นในยุคนี้ล้วนผ่านการทดลอง ทดสอบมาอย่างละเอียดแล้วเท่านั้น เพราะเป้าหมายในการเปลี่ยนคือทำยังไงให้รักษาความสนใจของลูกค้าผู้ใช้งานไว้ได้ และดึงผู้ใช้อย่างเราๆ อยู่บนแพลตฟอร์มของเค้าไปนานๆ นั่นเอง A/B Testing จึงมีบทบาทสำคัญในการทำทดสอบนี้ เพราะมันทำให้เราไม่ต้องมานั่งตัดสินใจว่าโฆษณาตัวใด แคมเปญตัวไหน ที่ลูกค้าเห็นแล้วจะคลิกเข้ามาดู กดสั่งซื้อได้มากที่สุด เพราะบางครั้งมนุษย์อาจจะใช้ ้ “อารมณ์ความรู้สึก” ตอนนั้นเองเป็นตัวตัดสินใจก็ได้ ซึ่งมันไม่ได้ช่วยให้เกิดผลดีต่อธุรกิจ เพราะอย่างนั้นการทดสอบอย่าง A/B Testing จึงเป็นตัวช่วยในเรื่องลด bias การตัดสินใจเลือกของบุคคลได้ (ก็คือให้กลุ่มทดลองมาช่วยตัดสินใจแทน) ในโพสต์นี้หนุ่มก็เลยจะพามาลองใช้ python ทำ A/B Testing กันนะฮะ สุดท้ายแล้วคุณผู้อ่านอาจจะเข้าใจ (หรืองงหนักกว่าเดิม) ในเรื่องของ A/B

    Continue Reading

  • เล่าประสบการณ์ Pitching งาน GEEKS2

    เล่าประสบการณ์ Pitching งาน GEEKS2

    สวัสดีครับคุณผู้อ่านทุกท่าน 👏 ครั้งนี้หนุ่มจะมีเขียนเล่าประสบการณ์การเข้าร่วมโครงการ GEEKS2 ของกรมควบคุมโรคนะครับ หรือในชื่อเต็ม “โครงการประชุมเชิงปฏิบัติการพัฒนาศักยภาพบุคลากรการแพทย์และสาธารณสุขด้านการจัดการข้อมูลและการวิเคราะห์ข้อมูล ภายใต้หลักสูตร “Growing Expertise in E-Health Knowledge and Skills” (GEEKS) รุ่นที่ 2” ตอนนั้นถือว่าเป็นโอกาสแบบแจ่มๆ เลยก็ว่าได้ หนุ่มเข้าเป็นพนักงานราชการที่กองดิจิทัลเพื่อการควบคุมโรคที่รับหน้าที่เป็นผู้จัดโครงการนี้ พอดีเป๊ะเลย พื้นฐานคอร์สอบรม โครงการมีการอบรม 2 หลักสูตรคือ Data science และ Data Engineer โดยเลือกอบรมได้ 1 หลักสูตร/คน เพราะทั้งสองอบรมพร้อมกัน เว้นแต่ผู้อบรมจะแบ่งภาคตัวเองได้ ฮ่าๆๆ ผู้ที่สมัครเข้ามาจะต้องเข้า section รวม (ทั้ง DS และ DE) เพราะต้องมาเรียนพื้นฐานที่จะใช้สอบคัดเลือก ประมาณ 2 วัน เรียนแบบออนไลน์นะครับ พื้นฐานที่ใช้สอบจะเป็นภาษา python โดยผู้สมัครจะต้องผ่านเกณฑ์ที่โครงการกำหนด จึงจะผ่านไปเรียนคอร์สสดได้ และแน่นอนว่าหนุ่มก็ผ่านเกณฑ์จึงได้เข้าไปเรียน แต่ไม่ได้แย่งที่นั่งของผู้สมัครโครงการนะครับ

    Continue Reading

  • Mini knowledge จากบทเรียน python

    Mini knowledge จากบทเรียน python

    หลังจากจบบทเรียน python ของ Data science bootcamp#11 ของแอดทอยแล้ว ในบทเรียนมีสอนหลายอย่างครับ ไม่ว่าจะเป็น … สุดท้ายก็มีการบ้านให้มาทบทวนความรู้ที่ได้ เป็นยังไงไปดูกัน Link Code เต็มๆ หนุ่ม Public ไว้ที่ DataLore นะค้าบ https://datalore.jetbrains.com/report/static/oyGEVJti8hBTc2Odm6CL2n/ckOM52Ffha742xL1B94S8o Link data source: https://drive.google.com/file/d/1bBu6Hpf4DID06cR1ktG-hS32WkkClv-U/view?usp=sharing อธิบายโค้ดได้ประมาณนี้ค้าบ 😎 หลังจากที่ได้ import library pandas, numpy และ import sample-store.csv เข้าสู่ dataframe แล้วมาตรวจสอบ data type ของแต่ละคอลัมน์ก่อน ข้อมูลส่วนใหญ่ pandas มองว่าเป็น object หรือ string จึงต้องมีการ convert data type ก่อน ก็จะมีคอลัมน์ order date,

    Continue Reading

  • Logistic Regression ทำนายการเกิดโรคเบาหวาน

    Logistic Regression ทำนายการเกิดโรคเบาหวาน

    ได้ฤกษ์เปิด mini project ใหม่ขึ้นมาอีกซักหนึ่ง ฮ่าๆๆ วันนี้เป็น Logistic Regression Model โดยใช้ชุดข้อมูล diabetes จาก Kaggle ภาพรวมเป็น Dataset ของผู้หญิงชนเผ่า Pima Indians มีอัตราการเกิดโรคเบาหวานประเภท 2 สูงที่สุดแห่งหนึ่งในโลก ไม่ว่าจะเป็นวิถีชีวิต การบริโภคอาหารที่มีไขมันและน้ำตาลสูงขึ้น และการออกกำลังกายน้อยลง มีส่วนทำให้ความชุกของโรคเบาหวานเพิ่มขึ้น ใน dataset: diabetes.csv มีทั้งหมด 768 แถว และ 9 คอลัมน์ มีรายละเอียด Data Dictionary ดังนี้ Features ใน dataset ความหมาย Pregnancies จำนวนครั้งที่ตั้งครรภ์ Glucose ระดับน้ำตาล (กลูโคส) ในเลือด (mg/dL) BloodPressure ค่าความดันโลหิต (mmHg) SkinThickness ความหนาของรอยพับผิวหนัง triceps

    Continue Reading

  • พาลง Titanic ด้วย Logistic Regression

    พาลง Titanic ด้วย Logistic Regression

    สวัสดีคุณผู้อ่านทุกท่านค้าบ 😆 ฮี่ๆ วันนี้พามาใช้ R ในการทำโมเดล Logistic regression กันฮะ โดยใช้ข้อมูลที่ Data Analyst น่าจะเคยผ่านหูผ่านตากันมาบ้างสักครั้งนึง เพราะ “ถ้าคุณโดด ผมโดด” 😭 และสุดท้ายหนุ่มต้องการจะสร้าง App เพื่อ Role play เป็นคนในเรือดูว่าจะรอด ไม่จม ไม่แข็งตายไปรึป่าว กดไล่ดูตามหัวข้อได้เลยคับ 🤝 รู้จักข้อมูลกันก่อน🥘 Prep ข้อมูลให้พร้อมใช้ในโมเดล🚂 Train Model: พี่จะสอนน้องเอง🧪 Test Model: ลองดูก่อน🍌มา Role play แบบเรียลไทม์กัน 🤝 รู้จักข้อมูลกันก่อน Data set นี้มาจาก library(titanic) ของ R มีเรคคอร์ดทั้งหมด 891 rows เป็น 891 คนที่ได้ขึ้นเรือไทนานิคและเก็บข้อมูลมาได้ (มั้งง?) Columns

    Continue Reading

  • ไปเก็บข้อมูล Pokémon ลง Pokédex ด้วย R กัน

    ไปเก็บข้อมูล Pokémon ลง Pokédex ด้วย R กัน

    หลังจากที่ได้เรียน Web Scraping 💻 ในคลาสเรียน R มาแล้ว วันนี้หนุ่มจะพาไปเก็บข้อมูล Pokémon จากหน้าเว็บ Static website ด้วยภาษา R กัน ต่อเนื่องจากบทความ ทำรายงานสถิติประจำเดือนง่ายๆ ด้วยภาษา R ก่อนหน้านี้ โดยหนุ่มจะใช้หน้าเว็บ List of Pokémon | Pokémon Wiki | Fandom นี้ ในการดึงข้อมูลออกมา ดาวน์โหลดรูปเก็บไว้ในเครื่อง และโหลดข้อมูลลง Google sheet ดูน้า พร้อมแล้วไปกันเลย List of contents Load library เบื้องต้นหนุ่มจะเรียกใช้ library พื้นฐาน 3 ตัวนะครับ Extract text from <table> tag จากที่บอกไปข้างต้นว่าหนุ่มจะใช้เว็บของ Fandom ในการดึงนะครับ

    Continue Reading

  • ทำรายงานสถิติประจำเดือนง่ายๆ ด้วยภาษา R

    ทำรายงานสถิติประจำเดือนง่ายๆ ด้วยภาษา R

    หลังจากที่ได้ลองใช้ Python ทำรายงานมาแล้ว คราวนี้ก็มาลองใช้ R ในการทำรายงานดูบ้างครับ เพราะหนุ่มเชื่อว่าแค่การเรียนอย่างเดียว มันจำไม่ได้หรอก ต้องเรียนจากประสบการณ์ และการใช้งานกับสถานการณ์จริงด้วย 😎 ครั้งนี้มาพร้อมกับโจทย์ที่ว่า “จำนวนผู้ป่วยทั้งหมดที่รับไว้ในหอผู้ป่วยในและอัตราการครองเตียงเดือนนี้เป็นเท่าใด? เพิ่มขึ้นหรือลดลงแค่ไหนเมื่อเทียบกับเดือนที่แล้ว” สร้างกราฟ และตารางตัวเลขให้พี่ด้วย หลังจากที่ไปดีลกับทีม DE รบกวนดึงข้อมูลให้หน่อยค้าบบ ได้ไฟล์มาแล้วก็มาเริ่มกันเลย ✌️ Import data เกริ่นไว้ก่อนนะครับ ข้อมูลที่ใช้แสดงตัดมาใช้แค่สองเดือนนะครับเป็นข้อมูลผู้ป่วยใน (In-patient Department: IPD) ของโรงพยาบาลและเข้ารหัส (Encode) ไว้แล้วน้า .. โอเค เริ่ม ใช้ Library readxl ในการอ่านไฟล์ Excel ที่ได้มาจากทีม DE ใช้ทั้งหมด 3 ชีท Data exploratory analysis มาสำรวจดูข้อมูลกันก่อน 🔍 แต่ละชีทมีข้อมูลเป็นยังไงมั้ง a. Raw Data ipd มีประมาณ

    Continue Reading

  • วิเคราะห์ความรู้สึกของลูกค้าจากคอมเมนต์ใน TikTok ด้วย python

    วิเคราะห์ความรู้สึกของลูกค้าจากคอมเมนต์ใน TikTok ด้วย python

    หลังจากที่เกริ่นไว้นานแล้วว่าจะเขียน post เกี่ยวกับ python บ้าง มาด้วยหัวข้อแรก ก็เริ่มจากวิเคราะห์ความรู้สึกของลูกค้าเลย disclaimer กันก่อนอันนี้เป็นโปรเจ็คลองทำนะครับ โค้ดอาจจะยึดยาวซักหน่อย จะได้เห็นที่มาที่ไปครับ เป็นยังไงไปดูกัน จากแนวคิดที่ได้ไปอบรมมา หนุ่มได้เรียน Web scrapping ทั้งที่เป็น Static และ Dynamic ในคอร์สอบรม Geeks ของกรมควบคุมโรค (ป้ายยาของเค้าดีจริงๆ) และก็ได้ลองทำตามบทความ >>link<< ของ อ.ดร.กานต์ ม.รังสิต ในการวิเคราะห์ความรู้สึกของลูกค้าที่คอมเมนต์เข้ามา หนุ่มก็เลยรวบองค์ความรู้ 2 อันนี้มาประกอบกันดู ซึ่งแบ่งออกเป็น 5 ขั้นตอนหลัก ดังนี้ Library เป็นโปรเจ็คที่ค่อนข้างเรียกใช้ Library ที่เยอะมากเหมือนกันนะเนี่ย หลักๆ ก็จะเป็น BeautifulSoup, Selenium, Regex, Altair, … มากมายค่อยๆ บอกว่าใช้ทำอะไรในขั้นต่อไปแล้วกันนะครับ —สำหรับ Library ไหนที่เครื่องท่านผู้อ่านยังไม่มี ให้ pip

    Continue Reading

  • [SQL] อยากรู้อันดับไหนล่ะ? เมื่อมากที่สุดอันดับ 2 ไม่พอ

    [SQL] อยากรู้อันดับไหนล่ะ? เมื่อมากที่สุดอันดับ 2 ไม่พอ

    เปิด LeetCode มาฝึกสมองกันอีกแล้ว คราวนี้ไม่ได้อยากรู้แค่มากที่สุดอันดับ 2 (ตามโพสต์ก่อนหน้านี้: link) ต้องการความ dynamic มากขึ้น อันดับไหนก็ได้ถ้าชั้นอยากรู้ เจ้าทาสทั้งหลายจงไปหาคำตอบมาให้ข้า .. ฮ่าๆๆ งั้นคงต้องเขียนเป็นฟังก์ชันแล้วล่ะ โอเคเริ่ม Table: Table: Employee Write a solution to find the nth highest salary from the Employee table. If there is no nth highest salary, return null. จงหา เงินเดือนที่สูงที่สุดตามอันดับที่ระบุ (nth) จากตารางทาส ถ้าไม่มีอันดับที่ต้องการส่ง null กลับมาจ้า The result format is in the following

    Continue Reading

Search

About

Feasible เว็บไซต์ที่นำเสนออาชีพปัจจุบันที่เรา (เจ้าของเว็บ) กำลังทำ ไม่ว่าจะเป็น นักวิเคราะห์ข้อมูล นักเรียน นักอ่าน นักฟาร์ม และอีกหลากหลายมุมมอง เรียกได้ว่าเป็น ‘แกงโฮะ’ เลยล่ะ ฮ่าๆๆ ติดตาม Content ที่จะทำออกมาได้เรื่อยๆ นะครับ ขอบคุณที่เข้ามาเยี่ยมกัน 😁✌️

Social Icons