Nick Untitled - A Kittisak's journal in AI, coding and life.

#15 แปลงข้อมูลจากไฟล์ให้เป็น Structured Data

Post author By Kittisak Chotikkakamthorn
Post date February 2, 2024

The English version is available in Medium.

ข้อมูลประเภท Unstructured Data เป็นข้อมูลที่ไม่มีโครงสร้างที่แน่นอนแบบที่ปรากฏในข้อมูลประเภท Structured Data และ Semi-Structured Data โดยตัวอย่างข้อมูลประเภทนี้ได้แก่ ไฟล์ รูปภาพ วิดีโอ และเสียง

Computer Data

#14 ดึงข้อมูลจาก Database มาโชว์ใน Dashboard

Post author By Kittisak Chotikkakamthorn
Post date January 31, 2024

ต่อมาโปรเจคก่อนหน้าที่ทำ Data Pipeline ที่ดึงข้อมูลไฟล์ Excel จากเว็บไซต์ของกระทรวงอว. (กระทรวงการอุดมศึกษา วิทยาศาสตร์ วิจัยและนวัตกรรม) คราวนี้เรามาทำอีกโปรเจคหนึ่งที่สร้าง Data Pipeline มาดึงข้อมูลจากฐานข้อมูล (Database) เพื่อนำมาทำ Dashboard

Computer Data

#13 ทำ Data Pipeline ดึง Data ต้นทุนนศ.ต่อปี

Post author By Kittisak Chotikkakamthorn
Post date January 26, 2024

ในภาพเอาท่อขนส่งมาเทียบกับ Data Pipeline ที่สื่อแบบเดียวกันคือการนำของจากต้นทาง (Source) ไปยังปลายทาง (Destination)

Data Pipeline คือกระบวนการลำเลียงข้อมูลจากแหล่งข้อมูล (Data Source) มายังจุดหมาย (Destination)

ข้อดีของการทำ Data Pipeline ตามกระบวนการนี้ ได้แก่ รวบรวมข้อมูลให้เป็นหนึ่งเดียว (Locality) กับไม่จำเป็นต้องต่อท่อตรงจาก Data Source ไปยัง Destination (Decoupling) และสามารถทำซ้ำได้ (Reproducible) เพื่อให้เราเก็บข้อมูลไว้สำหรับการนำข้อมูลไปประมวลผลใหม่อีกกี่รอบก็ได้ [1]

Computer

#12 – รู้จัก Apple MLX และเขียนโค้ด Linear Regression

Post author By Kittisak Chotikkakamthorn
Post date January 17, 2024

Apple MLX เป็นไลบรารีสำหรับงานทางด้าน Machine Learning ที่พัฒนาโดยทีมงาน Apple Machine Learning Research ที่ออกแบบมาเพื่อ Apple Silicon (ชิปแบบ M2, M3) โดยเฉพาะ โดยไลบรารีนี้มีฟีเจอร์ที่เด่น ๆ ได้แก่

Tags apple, Apple Silicon, artificial intelligence, coding, machine learning, numpy, python, PyTorch, การเรียนรู้ของเครื่อง, ปัญญาประดิษฐ์, แอปเปิล, ไพทอน, ไลบรารี

Computer

#11 – Linear Regression แบบเขียนมือ

Post author By Kittisak Chotikkakamthorn
Post date January 14, 2024

Linear regression เป็นความสัมพันธ์แบบเชิงเส้นระหว่างค่าที่เราต้องการทำนาย กับตัวแปรที่เรานำมาใช้ในการคำนวณ เทคนิคนี้เป็นเทคนิคที่ใช้มานานแล้ว กับเป็นเทคนิคที่เป็นโมเดลทางคณิตศาสตร์ที่เข้าใจง่าย ร่วมกับใช้งานได้หลากหลาย ตั้งแต่การศึกษา ไปจนถึงธุรกิจต่าง ๆ

Tags artificial intelligence, coding, computer, linear, python, regression, scikit-learn, statistics, supervised learning, การถดถอยเชิงเส้น, ปัญญาประดิษฐ์, สถิติ, โค้ดดิ้ง, ไพทอน

Computer

#10 – ปรับโมเดลให้แม่นขึ้นด้วย Two-Step Data Augmentation

Post author By Kittisak Chotikkakamthorn
Post date January 13, 2024

For English, please click this link to the original article published in GitHub Gist.

Data Augmentation คือเทคนิคที่ช่วยเพิ่มปริมาณของข้อมูลในชุดข้อมูล (Dataset) จากเดิมโดยการสังเคราะห์ข้อมูลขึ้นมาใหม่

เหตุผลที่ทำแบบนี้มาจากการเทรนโมเดลสำหรับใช้งานทางด้าน Computer Vision จำเป็นต้องใช้ข้อมูลที่มีปริมาณมาก แต่ติดปัญหาอย่างหนึ่งเลยคือข้อมูลที่เรามีอยู่มีปริมาณน้อย ไม่เพียงพอต่อการนำไปใช้เทรนโมเดล ดังนั้นแล้วเราจำเป็นต้องทำ Data Augmentation เพื่อช่วยเพิ่มความแม่นยำของโมเดลที่นำมาใช้งานทางด้าน Computer Vision

Tags 300W_LP, coding, computer vision, data augmentation, image processing, Pixel, programming, Transformation, การประมวลผลภาพ, คอมพิวเตอร์วิทัศน์, เขียนโปรแกรม, โค้ดดิ้ง, ไพทอน

Comment

#9 – เงินหยวนกับเงินดิจิทัลที่เพื่อไทยจะทำ

Post author By Kittisak Chotikkakamthorn
Post date October 9, 2023

อันนี้เขียนเป็นแพลตฟอร์มทวิตเตอร์ (หรือ X) มาก่อน แล้วขอเอามาเก็บไว้บนเว็บสำหรับการเก็บไว้อ่านทีหลัง หรือค้นหาบนกูเกิลแล้วเข้ามาเจอพอดี

พูดถึงเรื่องเงินดิจิทัล (หรือที่ทางพรรคเพือไทยจะทำคือ จะทำดิจิทัลวอลเล็ท (Digital Wallet) อันนี้นึกถึงประเทศจีนที่ใช้งานเงินหยวนดิจิทัล (Digital Yuan) ผ่านการใช้งาน CDBC (Central Bank Digital Currency)

Tags blockchain, CDBC, cryptocurrency, Digital Yuan, Economy, Pheu Thai, politics, การเมือง, คริปโต, เงินดิจิทัล, เศรษฐกิจ

Comment

#8 – พูด + รีวิวหลังดู The boy and the heron

Post author By Kittisak Chotikkakamthorn
Post date October 9, 2023

The boy and the heron (蒼鷺與少年) เป็นภาพยนตร์ของ Studio Ghibli (吉卜力工作室) ที่เป็นเจ้าเดียวกับที่ทำหนังดังอย่าง Spirited Away โดยผู้กำกับหนังเรื่องนี้คือ Hayao Miyazaki ที่ตั้งใจว่าจะรีไทร์ตัวเองมาหลายรอบแล้วก็ไม่รีไทร์ซะที แถมเจ้าตัวยังแจ้งว่าได้ไอเดียหนังใหม่อีก

Tags anime, boy, Commentary, ghibli, hayao, heron, japanese, movie, reivew, the boy and the heron, คอมเม้นต์, ภาพยนตร์, รีวิว

Computer

#7 – วิธีคัดกรองการแจ้งเตือนในทวิต

Post author By Kittisak Chotikkakamthorn
Post date September 20, 2023

ปกติเวลาที่เราใช้โซเชียลมิเดียของทวิตเตอร์ (หรือว่า X) สิ่งหนึ่งที่มีเหมือนทุกแอพบนโทรศํพท์มือถือ และทุกโซเชียลคือการแจ้งเตือน (Notifications) โดยลักษณะการแจ้งเตือนก็จะเป็นการแจ้งเตือนการกดปุ่มไลค์ การคอมเม้นต์ การส่งข้อความ และอื่น ๆ

เมื่อมีการแจ้งเตือนแล้ว สิ่งหนึ่งที่เป็นปัญหาที่พบบ่อยคือเวลาที่มีคนเข้ามาคอมเม้นต์เป็นจำนวนมาก แล้วแอพจะแจ้งเตือนผู้ใช้ตลอดเวลา ส่งผลให้รบกวนสมาธิของผู้รับการแจ้งเตือน ดังนั้นแล้วเราจำเป็นต้องคัดกรองการแจ้งเตือนของโซเชียลมิเดีย ในตัวอย่างนี้เราจะคัดกรองการแจ้งเตือนทวิตเตอร์ครับ

Tags distraction, notifications, productivity, social, social media, twitter, X, การแจ้งเตือน, ทวิต, ทวิตเตอร์, เอ็กซ์, โซเชียล, โนติ

Computer

#6 – ดูทวิตโดยไม่ล็อคอิน Twitter ด้วย Nitter

Post author By Kittisak Chotikkakamthorn
Post date September 4, 2023

Nitter คือเครื่องมือสำหรับทำเว็บเซิร์ฟเวอร์ที่อนุญาตให้ผู้ใช้สามารถเข้าไปดูทวิตใน Twitter (หรือ X) ที่เน้นเรื่องความเป็นส่วนตัว และประสิทธิภาพของการใช้งานเว็บไซต์ โดยโครงการนี้ได้รับแรงบันดาลใจจากโครงการ Invidious

Tags diary, nitter, open source, privacy, server, social, social media, tweet, twitter, website, X, ทวิตเตอร์, ทวีต, โซเชียล