SIPA Tech Meetup : Storage in Action

IMG_4733.JPG_800

เมื่อวันที่ 10 กันยายน 2559 ได้มีการจัดสัมมนา SIPA Technology Meetup 2016 : The Power of Collaboration เป็นการจัดงาน SIPA Technology Meetup ครั้งที่ 6 ที่ Centra Hotel, Government Complex, Cheangwattana ภายใต้กิจกรรมการศึกษาและจัดสัมมนาเชิงวิชาการถ่ายทอดเทคโนโลยีเพื่อการพัฒนาอุตสาหกรรม ของสำนักงานส่งเสริมอุตสาหกรรมซอฟต์แวร์แห่งชาติ (องค์การมหาชน) โดยมีผู้ให้ความสนใจเข้าร่วมงานอย่างล้นหลาม คุณสุวิมล เทวะศิลชัยกุล รองผู้อำนวยการสำนักงานส่งเสริมอุตสาหกรรมซอฟต์แวร์แห่งชาติ (องค์การมหาชน) กล่าวเปิดงานสัมมนา SIPA Technology Meetup 2016 ว่า การจัดงาน Tech MeetUp เป็นการจัดนำร่องในการนำเทคโนโลยีใหม่ๆ เข้ามา เพื่อ พัฒนาอุตสาหกรรม หรือ เผยแพร่ความรู้แก่ผู้ที่สนใจท ให้ทราบถึงความก้าวหน้าของเทคโนโลยีและแนวทางการพัฒนาในอนาคต เนื่องจากจะมีการเปลี่ยนเป็นกระทรวงดิจิทัลเพื่อเศรษฐกิจและสังคม รวมทั้งประเทศไทยกำลังนำนโยบาย Digital Economy มาใช้ จึงต้องพร้อมรับกับความรู้ใหม่ ๆ และเทคโนโลยีที่เปลี่ยนแปลงไปอย่างรวดเร็ว หัวข้อการสัมมนาในครั้งนี้ครอบคลุมหัวข้อ Storage in Action เพื่อให้ทราบถึงความสำคัญของ Storage, ทราบถึงวิธีการจัดการกับ Storage, File ขนาดเล็ก, File ขนาดใหญ่ หรือ File ที่อยู่บน Cloud งานสัมมนาดำเนินการในรูปแบบที่ต้องการให้เกิดการปฏิสัมพันธ์กันระหว่างวิทยากร และผู้เข้าร่วมสัมมนา เพื่อให้เกิดบรรยากาศที่มีความเป็นกันเอง มีการแลกเปลี่ยนความรู้ ความคิดเห็น และแชร์ประสบการณ์ร่วมกัน หากมีข้อสงสัยใดๆ สามารถซักถามและตอบข้อซักถามกันในระหว่างการสัมมนาได้
Lionel Lam, Senior Solutions Architect, Red Hat Inc. บรรยายในหัวข้อ Sustainable Cloud Storage Solution ได้กล่าวว่า ข้อมูล Social บน Internet เป็นปัจจัยสำคัญทำให้เกิดการขยายตัวของข้อมูลอย่างมหาศาล ส่งผลให้เกิดความต้องการพื้นที่ขนาดใหญ่ในการจัดเก็บข้อมูล สามารถเข้าถึงได้ทุกที่ทุกเวลา และยังต้องคำนึงถึงการดูแลรักษาข้อมูลไม่ให้สูญหาย การเกิดของ Cloud ทำให้ Storage ที่ใช้ในการจัดเก็บต้องมีความยืดหยุ่นในการจัดเก็บข้อมูล จึงเกิดแนวคิดใหม่ที่เรียกว่า Software Defined Storage ซึ่งเป็นแนวคิดของการเอา Software มาครอบ Storage หรือ Disk แล้วบริหารจัดการผ่าน Software โดยไม่มีข้อจำกัดทางยี่ห้อ Hardware อีกต่อไป Software Defined Storage จะมีการพัฒนาอย่างยั่งยืนต้องคำนึงถึง 1. On demand Provisioning of Storage : จัดเตรียมพื้นที่จัดเก็บข้อมูลตามพื้นที่การใช้งาน ไม่ต้องเผื่อพื้นที่ 2. Deployment Flexibility : มีความยืดหยุ่นในการติดตั้ง ไม่มีข้อจำกัดทางยี่ห้อ Hardware 3. Multi-tenancy สามารถให้บริการ/แบ่งทรัพยากรไปให้ผู้ใช้จำนวนมาก ทางบริษัท Red Hat กล่าวว่าเทคโนโลยี “Ceph Storage” สามารถนำไปใช้ในด้าน 1. Analytics 2. Cloud Infrastructure 3. Rich Media & Archival 4. Sync & Share 5. Enterprise Virtualization
คุณวนพงษ์ แก้วสิงห์, Senior Information Technology Officer, GISTDA – สำนักงานพัฒนาเทคโนโลยีอวกาศและภูมิสารสนเทศ (องค์การมหาชน) บรรยายในหัวข้อ How We Choose Storage for GISTDA ได้มาแบ่งปันประสบการณ์เรื่องการติดตั้ง Ceph Storage GISTDA เป็นหน่วยงานรัฐที่บริการข้อมูลภูมิสารสนเทศ และวิจัยและพัฒนาเทคโนโลยีอวกาศของประเทศไทย จึงมีความจำเป็นต้องการแหล่งจัดเก็บสำหรับ 1. ข้อมูลภาพถ่ายดาวเทียม 25 ดวง 2. ข้อมูลจากระบบ Coastal Radar 3. ข้อมูลจาก Sensor วัดระดับน้ำ ปัญหาของ GISTDA คือ การลงทุน Storage มีราคาสูง, Storage มีปัญหาระบบเกิด Downtime เจ้าหน้าที่ไม่สามารถแก้ไขเองได้ ต้องรอ Vendor เข้ามาดำเนินการ ต้องรออะไหล่ จากต่างประเทศ, ค่า Maintenance มีค่าใช้จ่ายสูงและเพิ่มขึ้นทุกปี, ปัจจุบันถูกบังคับให้ Upgrade ทั้งระบบเพราะมีแนวโน้มหยุดการผลิตอะไหล่รุ่นเก่า และนโยบายผู้บริหารให้มีการปรับลดค่า Maintenance ทาง GISTDA จึงตัดสินใจเลือก CephFS สำหรับ Share File System ดังนี้ 1. Mant CephFS 2. Use Samba 3. Authentication with GISTDA Active Directory ก่อนหน้าที่จะใช้ CephFS ทาง GISTDA ใช้ NAS+SAN Storage อยู่
คุณกิตติรักษ์ ม่วงมิ่งสุข, Chairman: Open Source Education and Development Association (OSEDA) บรรยายในหัวข้อ Big Data Hadoop and SPARK Technology Review ได้กล่าวว่า Big Data คือ ปริมาณข้อมูลที่มีขนาดใหญ่มหาศาลเกินกว่าขีดความสามารถในการประมวลผลของระบบฐานข้อมูลธรรมดาจะรองรับได้Big Data มีคุณลักษณะ 3 Vs : Volumn ข้อมูลจะต้องเยอะ, Velocity ข้อมูลจะต้องโตเร็ว, Variety ข้อมูลจะต้องมีหลากหลายรูปแบบทั้งที่เป็นแบบโครงสร้าง ไม่เป็นโครงสร้างหรือรูปแบบที่ไม่แน่นอน ซอฟต์แวร์ที่มีการนำมาใช้กันมากในระบบ Big data คือ Hadoop เพราะ Hadoop เป็น Open Source Technology พัฒนาขึ้นด้วยภาษา Java ที่จะทำหน้าที่เป็น Distributed Storage ที่สามารถเก็บข้อมูลขนาดใหญ่ที่เป็น Unstructure และนำมาประมวลผลได้ องค์ประกอบหลักๆของ Hadoop จะประกอบด้วย Hadoop Distributed File System (HDFS) และ MapReduce ใช้สำหรับประมวลผลข้อมูลที่มีขนาดใหญ่บน cluster Tool ที่เป็นที่นิยมอีกตัวหนึ่งคือ Spark เป็น tool สำหรับทำ Data Processing จุดขายของ Spark อยู่ที่ความเร็วในการประมวลผล (ประมวลผลใน memory ซึ่งเร็วกว่า cpu) เร็วกว่า MapReduce ของ Hadoop ได้ถึง 10 เท่า  Spark ประกอบไปด้วยส่วนประกอบสี่ส่วน คือ 1. Spark SQL 2. Spark Streaming (การโอน ย้ายข้อมูล stream) 3. MLib (สำหรับทำ Machine Learning) 4. GraphX

สำนักงานส่งเสริมอุตสาหกรรมซอฟต์แวร์แห่งชาติ องค์การมหาชน (SIPA) โดยคุณสิระ นักเทคโนโลยีสารสนเทศ ได้กล่าวว่า Storage นั้นมีความสำคัญ ไม่ว่าจะเป็น Ceph หรือ Hadoop ซึ่งเป็นหัวข้อการบรรยายในการสัมมนาครั้งนี้ การตัดสินใจเลือกใช้ Storage สำหรับการจัดเก็บข้อมูล และประมวลผลข้อมูล  ควรตัดสินใจเลือกให้ตรงกับการใช้งาน และเหมาะสมกับหน่วยงานหรือองค์กรของท่าน
ท่านที่สนใจงาน SIPA Technology Meetup สามารถติดตามได้ที่ www.sipatechmeetup.com หรือ www.facebook.com/sipatechmeetup

เผยแพร่ข่าวโดย:

พีอาร์ บุฟเฟ่ต์ www.prbuffet.com ข่าวประชาสัมพันธ์ online







Leave a Reply

Your email address will not be published.

This site uses Akismet to reduce spam. Learn how your comment data is processed.