-
แจก! Template Google Sheets จัดการงบและค่าใช้จ่ายส่วนบุคคลรายเดือน

เป็นเทมเพลตที่ออกแบบมาให้เก็บข้อมูลแยกค่าใช้จ่ายออกเป็นส่วนๆ เพื่อเห็นภาพรวมของแต่ละเดือนได้ ว่าเราใช้เงินไปกับสิ่งไหน หมวดไหนเยอะเป็นพิเศษ และจะพิจารณาลดค่าใช้จ่ายส่วนนั้นได้ยังไง มีฟีเจอร์อะไรบ้างไปดูกัน 1. จัดการสัดส่วนหมวดค่าใช้จ่าย เพื่อระบุว่าเราแบ่งเงินให้กับแต่ละหมวดกี่เปอร์เซ็น ซึ่งหมวดค่าใช้จ่ายจะแบ่งเป็น: รายจายทั่วไป (Expenses), บิลรายจ่าย (Bills), เงินออม (Savings), รายได้ (Income) และหนี้สิน (Debts) ทั้งยังสามารถระบุยอดยกมา (เงินเหลือจากเดือนก่อนหน้า) มาใช้ในการวางแผนค่าใช้จ่ายในเดือนปัจจุบันได้อีกด้วย 2. บันทึกรายการค่าใช้จ่าย เป็นส่วนที่ผู้ใช้งานเข้ามาบันทึกรายการกิจกรรมการใช้จ่ายเข้าไป โดยระบุวันที่ (หรือวันที่ดีล), หมวดหมู่, ประเภทค่าใช้จ่าย งบประมาณที่เราตั้งไว้ (budget) และค่าใช้จ่ายจริงๆ (actual) ที่เราจ่ายออกไป รวมถึงโน๊ตเตือนความจำได้ด้วย 3. Highlight ค้นหารายการค่าใช้จ่าย เพิ่มฟังก์ชันการค้นหารายการ ที่แท็บด้านบนขวาของตาราง Transactions นั้น เมื่อคลิกเลือกหวดหมู่ หรือประเภทค่าใช้จ่าย ตารางก็จะไฮไลท์สีให้เห็นชัดเจนขั้น เพื่อแก้ไขอัพเดทรายการนั้นๆ ได้ 4. ตารางสรุปค่าใช้จ่ายแต่ละหมวด จากตาราง Transactions ที่เราได้บันทึกมา ทั้งหมดจะนำไปจัดแยกแสดงและคำนวณยอดรวมให้เห็นที่ตารางทั้ง 5
-
Report Collection

ยินดีต้อนรับสู่ Report collection ของหนุ่มนะครับเป็นผลงานที่เคยทำไว้ จึงนำมาเก็บรวบรวมไว้ในนี้นะครับ ซึ่งก็จะแบ่งหัวข้อตามเครื่องมือที่ใช้งานเลยครับ Looker Studio 1. Pokédex Board เป็น Report ที่สร้างจากชุดข้อมูล Pokémon จากโพสต์ที่เคยพาไป Scraping ข้อมูลจากหน้าเว็บด้วย R จากนั้นจึงเอามาทดลองทำ Report ดูครับ และในสไลกด์สุดท้ายสามารถเรียกดู properties ของ Pokémon แต่ละตัวได้เลย Link: https://lookerstudio.google.com/reporting/25d65709-623e-4080-92c8-8fccf7269471 2. Sale and Profit Report เป็นชุดข้อมูล data_store.csv ที่เป็น transaction การขายสินค้าของร้านค้าแห่งนึง เก็บข้อมูลการสั่งซื้อของลูกค้าในแต่ละวัน ใช้เป็นชุดข้อมูลเพื่อฝึกการทำ Visualization ครับ Link: https://lookerstudio.google.com/reporting/77a4717e-1713-4726-9a24-35f788e4c126 Power BI 1. Nutrition screening and assessment report เป็นรายงานในโครงการโภชนบำบัดฯ เพื่อนำระบบการคัดกรองและประเมินภาวะโภชนาการผู้ป่วยไปติดตั้งให้กับโรงพยาบาลทั่วประเทศที่สนใจงานด้านโภชนบำบัด
-
มาลองฝึกทำ Cross-Validation ใน python กัน

ในบทความนี้ แอดจะพาไปใช้ cross-validation ในวิธีการต่างๆ แล้วดูว่ามันสำคัญยังไงในสายงาน data science และงาน Machine Learning ในทุกวันนี้ เรารู้ว่าการจะทำ ML นั้นมีความต้องการข้อมูลตั้งต้นในอดีตเป็นขา input ในจำนวนเยอะมากในการ train แล้วมันทำงานได้ดีกับข้อมูลในที่ถูกสร้างขึ้น real-time ในยุคนี้หรือไม่ ซึ่งข้อมูลขา input นั้นเราต้องเชื่อมั่นว่ามันจะเป็นตัวแทน และใช้พยากรณ์อนาคตได้ อย่างเช่น หากเราใช้ข้อมูลย้อนหลังถึง 20 ปี ต้องตั้งคำถามว่าข้อมูล 20 ปีที่แล้วมันจะสามารถพยากรณ์อนาคตได้ดีหรือไม่—ตอบคำถามนี้ให้ได้ก่อน เมื่อข้อมูลที่เรามีนั้นเราคิดว่ามันใช้ทำโมเดลได้ Cross-validation จึงเข้ามาเป็นตัวทดสอบว่าโมเดลที่เราสร้างขึ้นมาใช้งานนั้นมัน work จริงมั้ย โดยการแบ่งข้อมูล (splitting data) ออกเป็นส่วนๆ แล้ววันทดสอบซ้ำๆ ใช้ส่วนนึงไปเรียนรู้ (training) แล้วทดสอบความแม่นยำกับส่วนที่เหลือ (testing) ช่วยลดอาการที่โมเดลทำงานได้ดีเกินไปกับชุดข้อมูลในอดีต แต่ข้อมูลใหม่แย่ (overfitting) หรืออาการที่โมเดลทำงานได้ไม่ดีตั้งแต่เริ่ม หาความสัมพันธ์ของขา input และ output ไม่ได้เลย (underfitting)
-
4 ข้อดีๆ ของ Module CSV

ไฟล์ csv ไฟล์เก็บข้อมูลแบบเบสิคง่ายๆ ที่เราใช้แลกเปลี่ยนข้อมูลกันไปมานั้น ลองมาดูกันว่าเมื่อมันทำงานคู่กับโค้ด python แล้วมันจะเจ๋งแจ๋วสักแค่ไหนกัน csv หรือ comma-separated values แน่นอนเป็นไฟล์ที่ใช้เก็บข้อมูลประเภทตาราง แต่ละ row (บรรทัด) แสดงถึงข้อมูลแต่ละรายการ โดยใช้เครื่องหมาย , (comma) เป็นตัวคั่นแต่ละคอลัมน์ออกจากกัน มั่นใจว่าคุณผู้ป่านทุกท่านน่าจะเคยผ่านหูผ่านตา เคยใช้งานกับไฟล์ชนิดนี้มากันแล้วอย่างน้อยซักครั้ง ยิ่งท่านใดที่ใช้ python น่าจะเคย load data มันขึ้นมา process กันบ้างแหละเน๊อะ ตัวอย่าง เราได้ทำการอ่านไฟล์ csv: Social Sentiment Data ที่ได้มาจาก Kaggle และอ่านมันออกมาทุกคอลัมน์เลย จะได้ผลลัพธ์ออกมาเป็นแบบนี้ แล้ว Module csv ที่ว่าดีมันเป็นยังไง: 1. มัน Detect ตัวคั่น delimiter จากไฟล์ได้ โดยปกติแล้วไฟล์ csv ถูกออกแบบมาใช้ , (comma)
-
มาทำ AB Testing ใน python กัน

การทดลอง (Experimentation) เป็นวิธีการสำคัญในยุค Digital marketing ปัจจุบันอย่างมากกเลย รู้มั้ยครับว่า..เพลย์ลิสต์ของ Spotify, ปุ่มหยิบใส่ตะกร้าของ Shopee, ข้อความบนปุ่มกดตอนจะซื้อประกัน, การแสดงราคาสินค้าในเว็บ e-commerce ต่างๆ ในความจริงแล้วไม่ได้เกิดจากนักพัฒนาเว็บ อยากจะวางปุ่ม วางราคา วางส่วนลดที่ตำแหน่งไหนยังไงก็ได้ หรือวันหนึ่งตื่นขึ้นมาแล้วมาไอเดียก็เขียนเพิ่มแล้ววางองค์ประกอบนั้นเข้าไปในเว็บได้อย่างนั้นเลย ทุกการกระทำ หรือการเปลี่ยนแปลงของระบบ โปรแกรม แอพพลิเคชั่นในยุคนี้ล้วนผ่านการทดลอง ทดสอบมาอย่างละเอียดแล้วเท่านั้น เพราะเป้าหมายในการเปลี่ยนคือทำยังไงให้รักษาความสนใจของลูกค้าผู้ใช้งานไว้ได้ และดึงผู้ใช้อย่างเราๆ อยู่บนแพลตฟอร์มของเค้าไปนานๆ นั่นเอง A/B Testing จึงมีบทบาทสำคัญในการทำทดสอบนี้ เพราะมันทำให้เราไม่ต้องมานั่งตัดสินใจว่าโฆษณาตัวใด แคมเปญตัวไหน ที่ลูกค้าเห็นแล้วจะคลิกเข้ามาดู กดสั่งซื้อได้มากที่สุด เพราะบางครั้งมนุษย์อาจจะใช้ ้ “อารมณ์ความรู้สึก” ตอนนั้นเองเป็นตัวตัดสินใจก็ได้ ซึ่งมันไม่ได้ช่วยให้เกิดผลดีต่อธุรกิจ เพราะอย่างนั้นการทดสอบอย่าง A/B Testing จึงเป็นตัวช่วยในเรื่องลด bias การตัดสินใจเลือกของบุคคลได้ (ก็คือให้กลุ่มทดลองมาช่วยตัดสินใจแทน) ในโพสต์นี้หนุ่มก็เลยจะพามาลองใช้ python ทำ A/B Testing กันนะฮะ สุดท้ายแล้วคุณผู้อ่านอาจจะเข้าใจ (หรืองงหนักกว่าเดิม) ในเรื่องของ A/B
-
เล่าประสบการณ์ Pitching งาน GEEKS2

สวัสดีครับคุณผู้อ่านทุกท่าน 👏 ครั้งนี้หนุ่มจะมีเขียนเล่าประสบการณ์การเข้าร่วมโครงการ GEEKS2 ของกรมควบคุมโรคนะครับ หรือในชื่อเต็ม “โครงการประชุมเชิงปฏิบัติการพัฒนาศักยภาพบุคลากรการแพทย์และสาธารณสุขด้านการจัดการข้อมูลและการวิเคราะห์ข้อมูล ภายใต้หลักสูตร “Growing Expertise in E-Health Knowledge and Skills” (GEEKS) รุ่นที่ 2” ตอนนั้นถือว่าเป็นโอกาสแบบแจ่มๆ เลยก็ว่าได้ หนุ่มเข้าเป็นพนักงานราชการที่กองดิจิทัลเพื่อการควบคุมโรคที่รับหน้าที่เป็นผู้จัดโครงการนี้ พอดีเป๊ะเลย พื้นฐานคอร์สอบรม โครงการมีการอบรม 2 หลักสูตรคือ Data science และ Data Engineer โดยเลือกอบรมได้ 1 หลักสูตร/คน เพราะทั้งสองอบรมพร้อมกัน เว้นแต่ผู้อบรมจะแบ่งภาคตัวเองได้ ฮ่าๆๆ ผู้ที่สมัครเข้ามาจะต้องเข้า section รวม (ทั้ง DS และ DE) เพราะต้องมาเรียนพื้นฐานที่จะใช้สอบคัดเลือก ประมาณ 2 วัน เรียนแบบออนไลน์นะครับ พื้นฐานที่ใช้สอบจะเป็นภาษา python โดยผู้สมัครจะต้องผ่านเกณฑ์ที่โครงการกำหนด จึงจะผ่านไปเรียนคอร์สสดได้ และแน่นอนว่าหนุ่มก็ผ่านเกณฑ์จึงได้เข้าไปเรียน แต่ไม่ได้แย่งที่นั่งของผู้สมัครโครงการนะครับ
-
Mini knowledge จากบทเรียน python

หลังจากจบบทเรียน python ของ Data science bootcamp#11 ของแอดทอยแล้ว ในบทเรียนมีสอนหลายอย่างครับ ไม่ว่าจะเป็น … สุดท้ายก็มีการบ้านให้มาทบทวนความรู้ที่ได้ เป็นยังไงไปดูกัน Link Code เต็มๆ หนุ่ม Public ไว้ที่ DataLore นะค้าบ https://datalore.jetbrains.com/report/static/oyGEVJti8hBTc2Odm6CL2n/ckOM52Ffha742xL1B94S8o Link data source: https://drive.google.com/file/d/1bBu6Hpf4DID06cR1ktG-hS32WkkClv-U/view?usp=sharing อธิบายโค้ดได้ประมาณนี้ค้าบ 😎 หลังจากที่ได้ import library pandas, numpy และ import sample-store.csv เข้าสู่ dataframe แล้วมาตรวจสอบ data type ของแต่ละคอลัมน์ก่อน ข้อมูลส่วนใหญ่ pandas มองว่าเป็น object หรือ string จึงต้องมีการ convert data type ก่อน ก็จะมีคอลัมน์ order date,
-
Logistic Regression ทำนายการเกิดโรคเบาหวาน

ได้ฤกษ์เปิด mini project ใหม่ขึ้นมาอีกซักหนึ่ง ฮ่าๆๆ วันนี้เป็น Logistic Regression Model โดยใช้ชุดข้อมูล diabetes จาก Kaggle ภาพรวมเป็น Dataset ของผู้หญิงชนเผ่า Pima Indians มีอัตราการเกิดโรคเบาหวานประเภท 2 สูงที่สุดแห่งหนึ่งในโลก ไม่ว่าจะเป็นวิถีชีวิต การบริโภคอาหารที่มีไขมันและน้ำตาลสูงขึ้น และการออกกำลังกายน้อยลง มีส่วนทำให้ความชุกของโรคเบาหวานเพิ่มขึ้น ใน dataset: diabetes.csv มีทั้งหมด 768 แถว และ 9 คอลัมน์ มีรายละเอียด Data Dictionary ดังนี้ Features ใน dataset ความหมาย Pregnancies จำนวนครั้งที่ตั้งครรภ์ Glucose ระดับน้ำตาล (กลูโคส) ในเลือด (mg/dL) BloodPressure ค่าความดันโลหิต (mmHg) SkinThickness ความหนาของรอยพับผิวหนัง triceps
-
พาลง Titanic ด้วย Logistic Regression

สวัสดีคุณผู้อ่านทุกท่านค้าบ 😆 ฮี่ๆ วันนี้พามาใช้ R ในการทำโมเดล Logistic regression กันฮะ โดยใช้ข้อมูลที่ Data Analyst น่าจะเคยผ่านหูผ่านตากันมาบ้างสักครั้งนึง เพราะ “ถ้าคุณโดด ผมโดด” 😭 และสุดท้ายหนุ่มต้องการจะสร้าง App เพื่อ Role play เป็นคนในเรือดูว่าจะรอด ไม่จม ไม่แข็งตายไปรึป่าว กดไล่ดูตามหัวข้อได้เลยคับ 🤝 รู้จักข้อมูลกันก่อน🥘 Prep ข้อมูลให้พร้อมใช้ในโมเดล🚂 Train Model: พี่จะสอนน้องเอง🧪 Test Model: ลองดูก่อน🍌มา Role play แบบเรียลไทม์กัน 🤝 รู้จักข้อมูลกันก่อน Data set นี้มาจาก library(titanic) ของ R มีเรคคอร์ดทั้งหมด 891 rows เป็น 891 คนที่ได้ขึ้นเรือไทนานิคและเก็บข้อมูลมาได้ (มั้งง?) Columns
-
ขมวดปึ้งงง ✨ 10 ข้อที่น่าสนใจใน Statistics

วันนี้พาคุณผู้อ่านมาทำความรู้จักสถิติ (Statistic) กันซะหน่อย อาจจะเป็นฝันร้ายในวันวานของใครบางคน (รวมถึงเราด้วย) วันนี้ได้เปิดโลกเลยพยายามทำความเข้าใจมันมากขึ้น แล้วก็เอาสิ่งที่ได้มาฝากคุณผู้อ่านอีกเช่นเคย เป็นยังไง หัวข้อไหนปึ้งบ้างไปดูกันฮะ 😁 1. คำว่า “statistic” 📊 มาจากคำว่า “state” 🗺️ คำว่า “statistics” มีรากศัพท์มาจากคำภาษาละติน “status” (หมายถึง “สถานะ” หรือ “สภาวะ”) และต่อมาได้พัฒนาผ่านภาษาอิตาลี “statista” (หมายถึง “รัฐบุรุษ” หรือ “นักการเมือง”) และภาษาเยอรมัน “Statistik” ในอดีตสถิติถูกนำมาใช้ในการรวบรวมและวิเคราะห์ข้อมูลเกี่ยวกับรัฐไม่ว่าจะเป็นข้อมูลประชากร การค้า และภาษี เพื่อใช้ในการบริหารและปกครองรัฐ ดังนั้น ควาเชื่อมโยงระหว่างคำว่า “statistics” กับ “state” จึงมาจากจุดเริ่มต้นของการใช้สถิติในการวิเคราะห์ข้อมูลของรัฐนั่นเอง ได้มีการนิยามคำว่า “สถิติ” มากกมายในงานวิจัยของไทย ซึ่งขอสรุปเป็นภาษาของเราคือ … วิธีการที่เราพยายามจะเข้าใจโลกนี้ ผ่านการเรียนรู้จากกลุ่มตัวอย่าง โดยมีเป้าหมายเพื่อการตัดสินใจที่ดีขึ้น อย่างเช่น เราอยากจะรู้ว่าประชากร (Population) ทั้งหมดคิดเห็นอย่างไร
Search
About
Feasible เว็บไซต์ที่นำเสนออาชีพปัจจุบันที่เรา (เจ้าของเว็บ) กำลังทำ ไม่ว่าจะเป็น นักวิเคราะห์ข้อมูล นักเรียน นักอ่าน นักฟาร์ม และอีกหลากหลายมุมมอง เรียกได้ว่าเป็น ‘แกงโฮะ’ เลยล่ะ ฮ่าๆๆ ติดตาม Content ที่จะทำออกมาได้เรื่อยๆ นะครับ ขอบคุณที่เข้ามาเยี่ยมกัน 😁✌️





