LATEST ARTICLES

hive-hadoop-example

The Big Data World : Hive – ตอนที่สอง

หลังจากเรียนรู้ว่า Big Data ในภาพกว้างมาแล้ว คงจะเข้าใจกันขึ้นว่าภาพรวมของ Hadoop Ecosystem เป็นยังไงและจะลองเล่นกับ Hadoop บนเครื่องตัวเองอย่างไรกันแล้ว ... ถ้ายังไม่ได้อ่าน ไปอ่านเพิ่มได้ที่นี้เลย The Big Data World – ตอนที่หนึ่ง :)ทีนี้เรามาเจาะลึกถึงการใช้งานกับ Hadoop กันเถอะ ... ซึ่งวันนี้เราจะมาเรียนรู้เรื่องของ Hive กัน โดยขอย้อนกลับไปที่ ecosystem นิดนึงน่ะจะเห็นว่า Hive ถูกสร้างขึ้นบน MapReduce นั้นหมายถึงมันเป็น...
the-world-of-big-data-feature-image

The Big Data World – ตอนที่หนึ่ง

คงปฎิเสธไม่ได้ว่าในโลกปัจจุบันนี้ทุกอย่างกลายเป็นเรื่องของข้อมูลทั้งหมดแล้ว ไม่ว่าเราจะตัดสินใจจะทําอะไรซักอย่างก็ต้องใช้ข้อมูลที่เรามีทั้งสิ้น เพราะฉะนั้นเลยมีคําที่ถึงขั้นว่า "Data is new oil" กันเลยทีเดียว เปรียบเสมือนเป็นยุคในการขุดนํ้ามันเลยก็ว่าได้ :)แต่คนทั่วไปส่วนใหญ่ใช้คําว่า Big Data ไปในเชิง Marketing ให้ฟังดูดีซะมากกว่า เห็นได้จากโฆษณาทางทีวีบ่อยๆ .... แต่จริงๆแล้ว Big Data ไม่ได้มากเหนือไปกว่าแค่ฐานข้อมูลขนาดใหญ่ที่รองรับข้อมูลขนาดล้านๆกิ๊กกะไบท์เลย เพราะฉะนั้นเวลาใครบอกว่าใช้ Big Data ก็ต้องคิดกันต่อเลยว่าข้อมูลเอามาจากไหน? เอาข้อมูลที่มีไปใช้ทําอะไร? ประยุกต์เป็นอะไรต่อ? แล้วนําเสนอข้อมูลยังไง? เพื่อให้คนเข้าถึงได้เยอะแยะไปหมดกับการเล่นกับข้อมูลนี้ ดังนั้นเรามาเริ่มเรียนรู้มันอย่างจริงจังกันเลยดีกว่าว่า Big Data...
python-list-comprehension-generator

Python Comprehension & Generator

บทความนี้เราจะมาเรียนถึง Pattern ของ comprehension และ Generator ที่น่าสนใจเพื่อนําไปใช้งานจริง โดยเริ่มจาก concept ของ comprehension ว่าคืออะไร? List Comprehensions เจ้า List Comprehension คือ concept ง่ายๆ concept นึงใน Python ที่ใช้ในการสร้าง List ขึ้นมานั้นเองโดยจะมี Pattern ที่ไม่เหมือนชาวบ้าน และ อ่านเข้าใจยากหน่อย คือหรือดูจากตัวอย่างข้างล่างนี้ก็ได้# example 1 -...
python-date-and-time

จัดการ Dates & Time ด้วย Python

Module Dates & Time ใน python เป็นอะไรที่ง่ายดี โดยหลักการณ์ของ DateTimes ใน python มีแค่ 2 ​ส่วนหลักๆคือNaive = ข้อมูลของเวลาทั่วๆไป เช่น พวก Coordinated Universal Time (UTC), local time ไม่ได้มี algorithm อะไรเพื่อให้ง่ายใช้ในงานพื้นฐาน Aware = อันนี้จะฉลาดหน่อยมีความสามารถเรื่องของ timezone,...
python-data-science-toolbox

Python Data Science Toolbox

ในปัจจุบันการวิเคราะห์ข้อมูลต่างเนี่ย มันมีเครื่องมือและภาษาที่หลากหลากมากเพื่อนํามาใช้ให้ได้ผลลัพธ์ออกมา ซึ่งตัวหลักๆ ที่ยอดนิยมก็จะเป็น ภาษา R และ Python นั้นเองวันนี้เราจะมาพูดภาพรวมของ Python Toolbox ซึ่งเป็นเครื่องมือยอดนิยมที่ใช่ในการวิเคราะห์ข้อมูล ได้แก่Numpy Matplotlib Pandasโดยจะอธิบายโดยรวมว่ามันมีประโยชน์ยังไงและน่าสนใจยังไงแล้วบทความต่อๆไปค่อยนํามาใช้งานเป็น workshop ให้ดูอีกที :) แต่หลักๆแล้ว Eco-System ของ Python Data Science Toolbox ก็จะมีตามรูปด้านล่างนี้เลยNumpy ชื่อจริงของมันก็คือ Numeric Python แต่คนส่วนใหญ่จะเรียกว่า Numpy มันเป็น...