Category: Data

#15 แปลงข้อมูลจากไฟล์ให้เป็น Structured Data

Post author By Kittisak Chotikkakamthorn
Post date February 2, 2024

The English version is available in Medium.

ข้อมูลประเภท Unstructured Data เป็นข้อมูลที่ไม่มีโครงสร้างที่แน่นอนแบบที่ปรากฏในข้อมูลประเภท Structured Data และ Semi-Structured Data โดยตัวอย่างข้อมูลประเภทนี้ได้แก่ ไฟล์ รูปภาพ วิดีโอ และเสียง

Computer Data

#14 ดึงข้อมูลจาก Database มาโชว์ใน Dashboard

Post author By Kittisak Chotikkakamthorn
Post date January 31, 2024

ต่อมาโปรเจคก่อนหน้าที่ทำ Data Pipeline ที่ดึงข้อมูลไฟล์ Excel จากเว็บไซต์ของกระทรวงอว. (กระทรวงการอุดมศึกษา วิทยาศาสตร์ วิจัยและนวัตกรรม) คราวนี้เรามาทำอีกโปรเจคหนึ่งที่สร้าง Data Pipeline มาดึงข้อมูลจากฐานข้อมูล (Database) เพื่อนำมาทำ Dashboard

Computer Data

#13 ทำ Data Pipeline ดึง Data ต้นทุนนศ.ต่อปี

Post author By Kittisak Chotikkakamthorn
Post date January 26, 2024

ในภาพเอาท่อขนส่งมาเทียบกับ Data Pipeline ที่สื่อแบบเดียวกันคือการนำของจากต้นทาง (Source) ไปยังปลายทาง (Destination)

Data Pipeline คือกระบวนการลำเลียงข้อมูลจากแหล่งข้อมูล (Data Source) มายังจุดหมาย (Destination)

ข้อดีของการทำ Data Pipeline ตามกระบวนการนี้ ได้แก่ รวบรวมข้อมูลให้เป็นหนึ่งเดียว (Locality) กับไม่จำเป็นต้องต่อท่อตรงจาก Data Source ไปยัง Destination (Decoupling) และสามารถทำซ้ำได้ (Reproducible) เพื่อให้เราเก็บข้อมูลไว้สำหรับการนำข้อมูลไปประมวลผลใหม่อีกกี่รอบก็ได้ [1]

Computer Data

#5 ติดตั้ง Docker เพื่อใช้งาน AI/ML

Post author By Kittisak Chotikkakamthorn
Post date September 2, 2023

ปัญหาสำหรับงาน Machine Learning ส่วนหนึ่งเลยคือปัญหาการติดตั้ง และจัดการ Environment สำหรับการใช้งานทีประกอบไปด้วยปัญหาการติดตั้งเครื่องมือ ปัญหาการติดตั้งไลบรารี และปัญหาการตั้งค่า

ปัญหาเหล่านี้ส่งผลทำให้งานเป็นไปได้ล่าช้า หรือถึงแม้ติดตั้งเองได้แต่ก็ลืม รวมถึงถึงติดตั้งได้ แต่เครื่องมือเหล่านี้ก็เป็นเวอร์ชันเก่าแล้ว

Tags ai, artificial intelligence, cli, command line, computer, container, Container Toolkit, diary, Docker, linux, machine learning, ml, NVIDIA, programming, คอนเทนเนอร์, ลินุกซ์, เขียนโปรแกรม

Computer Data

#4 – วิธีโหลดไฟล์ลง Google Drive ด้วย Colab

Post author By Kittisak Chotikkakamthorn
Post date August 28, 2023

ปกติเวลาดาวน์โหลดไฟล์จากเว็บมาลงบนคอมพิวเตอร์เราก็จะบันทึกลงคอมพิวเตอร์ของเราตามปกติโดยการกดปุ่มดาวน์โหลดในหน้าเว็บไซต์ของแต่ละเว็บไซต์

อย่างไรก็ตาม กรณีที่เราอยู่ข้างนอกที่ใช้เน็ตมือถือ หรือพักโรงแรมที่เน็ตมันไม่เร็วมาก ถ้าเราดาวน์โหลดไฟล์ตามปกติ เราก็จะใช้ Bandwidth เป็นจำนวนมาก หรือต้องรอดาวน์โหลดไฟล์กว่าจะเสร็จก็ใช้ระยะเวลานาน

Tags coding, colab, colaboratory, computer, download, drive, files, google, programming, script, storage, เขียนโปรแกรม

Computer Data

ทำ Synthetic Head Pose Dataset เพื่อเทรน AI

Post author By Kittisak Chotikkakamthorn
Post date January 22, 2023

ปกติเวลาที่เทรนโมเดล AI ที่เป็น Deep Learning สิ่งหนึ่งที่โมเดลเหล่านี้ต้องการสำหรับการเทรนโมเดลคือข้อมูล Dataset สำหรับการฝึกที่มีข้อมูลเป็นจำนวนมาก อย่างไรก็ตามปัญหาหนึ่งคือไม่มี Dataset ที่มีจำนวนมากพอสำหรับการเทรน

วิธีทั่วไปที่ทำก็ออกไปเก็บข้อมูล และจัดทำ Ground Truth สำหรับการเทรนโมเดล AI เพิ่ม ซึ่งโอเค อย่างไรก็ดีมีอีกวิธีหนึ่งที่เราสามารถทำได้คือการสังเคราะห์ชุดข้อมูล Dataset ขึ้นมา (หรือเรียกว่าทำ Synthetic Dataset)

Tags 300W_LP, 3ddfa, ai, artificial intelligence, Augmentation, coding, Dataset, deep learning, Face alignment, face detection, Facial Landmark, fan, head pose estimation, python, RetinaFace, synthesis

Computer Data

วิธีการทำ Object Detection โดย Nanodet

Post author By Kittisak Chotikkakamthorn
Post date December 25, 2022

Object detection คือขั้นตอนการหาตำแหน่งวัตถุจากภาพโดย AI ตามที่กำหนดไว้ ได้แก่ คน รถยนต์ จักรยาน และอื่น ๆ โดยผลลัพธ์ที่ได้จากการใช้งานเทคนิคนี้จะแสดงผลในรูปแบบกรอบสี่เหลี่ยม Bounding box พร้อมกับจำแนก Class ของภาพที่จับได้ว่าเป็นอะไร

Tags ai, artificial intelligence, COCO, coding, computer, nanodet, object detection, programming, python, PyTorch, training, คอมพิวเตอร์, โค้ดดิ้ง

Computer Data

ปรับโมเดล ONNX ให้ไวด้วย Static Quantization

Post author By Kittisak Chotikkakamthorn
Post date November 24, 2022

ปกติเมื่อเราเทรนโมเดลที่ต้องใช้ระยะเวลาหลายชั่วโมง ไปจนถึงหลายวันเสร็จเรียบร้อยแล้ว เราจะต้องนำโมเดลไปใช้งานบนเซิร์ฟเวอร์ หรืออุปกรณ์ฝังตัวขนาดเล็กเพื่อนำไปใช้งานจริง อย่างไรก็ตามโมเดลมันมีขนาดใหญ่ ต้องใช้พลังการประมวลผลมาก แล้วเราจะต้องใช้เทคนิคอะไรมาช่วยล่ะ?

คำตอบที่เหมาะสมกับปัญหานี้คือ Quantization

Tags coding, computer, float, float32, int8, onnx, programming, python, quantization, static quantization, คอมพิวเตอร์, เขียนโปรแกรม, โค้ดดิ้ง

Computer Data

วิธีการสร้างไฟล์ Excel ด้วย SheetJS

Post author By Kittisak Chotikkakamthorn
Post date August 6, 2022

การส่งออกไฟล์ในรูปแบบ Excel เดิมถ้าจะเอาวิธีแบบง่าย ๆ เลยคือการส่งออกไฟล์ในรูปแบบ CSV ที่เป็นไฟล์ข้อความที่แบ่งข้อมูลระหว่างคอลัมภ์ด้วยการใช้ตัวอักษรคอมมา (,) เพื่อแบ่งข้อมูล โดยการส่งออกไฟล์ในลักษณะนี้เราส่งออกไฟล์ได้ด้วยการพิมพ์คำสั่ง

Tags coding, csv, export, javascript, library, programming, SheetJS, SheetJS Community, XLSX, ตาราง, ออฟฟิศ, เขียนโปรแกรม, เอกซ์เซล, โค้ดดิ้ง

Computer Data

ROG Flow X13: การตั้งค่าและทดสอบกับ AI/ML

Post author By Kittisak Chotikkakamthorn
Post date July 10, 2022
1 Comment on ROG Flow X13: การตั้งค่าและทดสอบกับ AI/ML

เดิมทีเรามีโน้ตบุ๊คตัวเก่าอย่าง Surface Pro X ที่ใช้อยู่แล้วครับ เพียงแต่ช่วงนี้เครื่องอืดไปหน่อยสำหรับการใช้งานทางด้าน AI/ML ด้าน Computer Vision แถมคอมตั้งโต๊ะที่มีอยู่ก็พกพาไปไหนก็ไม่สะดวก และคอมที่แล็บก็ต้องรีโมทเข้าไปใช้งานก็ไม่สะดวกเช่นกัน เลยมองหาโน้ตบุ๊คซักตัวสำหรับการพกพา