วันอังคารที่ 16 ตุลาคม พ.ศ. 2561

บทที่ 5 โครงสร้างพื้นฐานด้านเทคโนโลยีสารสนเทศ

Client/Server คืออะไร

          Client คือ เครื่องคอมพิวเตอร์ที่ไปร้องขอบริการและรับบริการอย่างใดอย่างหนึ่งจาก Serverserver คือเครื่องคอมพิวเตอร์หรือระบบปฏิบัติการหรือโปรแกรมคอมพิวเตอร์ ที่ทำหน้าที่ให้บริการอย่างใดอย่างหนึ่งหรือหลายอย่าง โดยอาศัยโปรแกรม Web server แก่เครื่องคอมพิวเตอร์หรือโปรแกรมคอมพิวเตอร์ที่เป็นลูกข่าย ในระบบเครื่อข่ายserver แบ่งเป็น 3 ประเภทได้แก่          1. เครื่องคอมพิวเตอร์ที่ทำหน้าที่ให้บริการอะไรบางอย่างแก่คอมพิวเตอร์หรือโปรแกรมคอมพิวเตอร์อื่น          2. ระบบปฏิบัติการคอมพิวเตอร์ที่ทำหน้าที่ให้บริการอะไรบางอย่างแก่คอมพิวเตอร์หรือโปรแกรมคอมพิวเตอร์อื่น          3.โปรแกรมคอมพิวเตอร์ที่ทำหน้าที่ให้บริการอะไรบางอย่างแก่คอมพิวเตอร์หรือโปรแกรมคอมพิวเตอร์อื่น


          client/server คือ การที่มีเครื่องผู้ให้บริการ (server) และเครื่องผู้ใช้บริการ (client) เชื่อมต่อกันอยู่ และเครื่องผู้ใช้บริการได้มีการติดต่อร้องขอบริการจากเครื่องผู้ให้บริการ เครื่องผู้ให้บริการก็จะจัดการตามที่เครื่องผู้ขอใช้บริการร้องขอ แล้วส่งข้อมูลกลับไปให้เครือข่ายแบบ Client / server เหมาะกับระบบเครือข่ายที่ต้องการเชื่อมต่อกับเครื่องลูกข่ายจำนวนมาก โดยการรองรับจำนวนเครื่องลูกข่าย (Client ) อาจเป็นหลักสิบ หลักร้อย หรือหลักพัน เพราะฉะนั้นเครื่องที่จะนำมาทำหน้าที่ให้บริการจะต้องเป็นเครื่องที่มี ประสิทธิภาพสูง เนื่องจากถูกต้องออกแบบมาเพื่อทนทานต่อความผิดพลาด ( Fault Tolerance ) และต้องคอยให้บริการทรัพยาการให้กับเครื่องลูกข่ายตลอดเวลา โดยเครื่องที่จะนำมาทำเป็นเซิร์ฟเวอร์อาจเป็นคอมพิวเตอร์แบบเมนเฟรม มินิคอมพิวเตอร์ หรือไมโครคอมพิวเตอร์ก็ได้

Packet Switching 

          Packet Switching คือเทคโนโลยีที่ใช้สำหรับการส่งข้อมูล โดยการแบ่งข้อมูลออกเป็นหลาย ๆ packet เพื่อให้มีขนาดเล็กลง แล้วจึงกระจายกันออกไปผ่านเครือข่ายในเส้นทางต่าง ๆ ด้วยความเร็วที่ต่างกัน เพราะ Packet Switching จะทำการหาเส้นทางที่เหมาะสมตั้งแต่ต้นทางจนถึงปลายทางให้กับแต่ละ packet หากมี packet ใดผิดพลาดหรือไม่สามารถส่งต่อได้ ระบบก็จะทำการส่ง packet ดังกล่าวให้ใหม่ทันที และเมื่อข้อมูลทั้งหมดไปถึงผู้รับแล้ว คอมพิวเตอร์ที่เครื่องปลายทางจะจัดลำดับข้อมูลจาก packet ที่ได้รับให้ถูกต้อง

Packet Switching

TCP/IP คืออะไร

          การที่เครื่องคอมพิวเตอร์ที่ถูกเชื่อมโยงกันไว้ในระบบ  จะสามารถติดต่อสื่อสารกันได้นั้น จำเป็นจะต้องมีภาษาสื่อสารที่เรียกว่า โปรโตคอล (Protocol) ซึ่งในระบบ Internet จะใช้ภาษาสื่อสารมาตรฐานที่ชื่อว่า TCP/IP เป็นภาษาหลัก ดังนั้นหากเครื่องคอมพิวเตอร์ไม่ว่าจะเป็นเครื่องระดับไมโครคอมพิวเตอร์ มินิคอมพิวเตอร์ หรือเมนเฟรมคอมพิวเตอร์ ก็สามารถเชื่อมโยงเข้าสู่อินเทอร์เน็ตได้          TCP  ย่อมาจากคำว่า   Transmission Control Protocol          IP   ย่อมาจากคำว่า   Internet  Protocol

          TCP/IP คือชุดของโปรโตคอลที่ถูกใช้ในการสื่อสารผ่านเครือข่ายอินเทอร์เน็ต โดยมีวัตถุประสงค์เพื่อให้สามารถใช้สื่อสารจากต้นทางข้ามเครือข่ายไปยังปลายทางได้และสามารถหาเส้นทางที่จะส่งข้อมูลไปได้เองโดยอัตโนมัติ 

TCP และ IP มีหน้าที่ต่างกัน คือ
          1. TCP จะทำหน้าที่ในการแยกข้อมูลเป็นส่วน ๆ หรือที่เรียกว่า Package ส่งออกไป ส่วน TCP ปลายทาง ก็จะทำการรวบรวมข้อมูลแต่ละส่วนเข้าด้วยกัน เพื่อนำไปประมวลผลต่อไป โดยระหว่างการรับส่งข้อมูลนั้นก็จะมีการตรวจสอบความถูกต้องของ ข้อมูลด้วย ถ้าเกิดผิดพลาด TCP ปลายทางก็จะขอไปยัง TCP ต้นทางให้ส่งข้อมูลมาใหม่
          2. IP จะทำหน้าที่ในการจัดส่งข้อมูลจากเครื่องต้นทางไปยังเครื่องปลายทางโดยอาศัย 
IP Address



ความแแตกต่างชนิดของเครือข่าย

ความแตกต่างของ Analog และ Digital
         เคยได้ยินกันใช่หรือไม่ ทั้งคำว่า “ Analog” และคำว่า “Digital”  ทั้ง 2 คำนี้นับเป็นพื้นฐานสำคัญของการก่อเกิดเทคโนโลยีต่างๆ โดยเฉพาะที่เกี่ยวข้องกับสัญญาณหรือ โทรคมนาคม  แล้วทราบกันหรือไม่ว่าทั้ง 2 คำนี้มีความแตกต่างกันอย่างไร
         สัญญาณที่ใช้ในระบบสื่อสารแบ่งออกได้เป็น 2 ประเภทคือ สัญญาณอนาลอกและสัญญาณดิจิตอล
         สัญญาณอนาลอก (Analog Signal) หมายถึงสัญญาณข้อมูลแบบต่อเนื่อง (Continuouse Data) มีขนาดของสัญญาณไม่คงที่มีการเปลี่ยนแปลงขนาดของสัญญาณแบบค่อยเป็นค่อยไป มีลักษณะเป็นเส้นโค้งต่อเนื่องกันไป โดยการส่งสัญญาณแบบอนาล็อกจะถูกรบกวนให้มีการแปลความหมายผิดพลาดได้ง่าย เช่น สัญญาณเสียงในสายโทรศัพท์ เป็นต้น
         สัญญาณดิจิตอล(Digital Signal) หมายถึง สัญญาณที่เกี่ยวข้องกับข้อมูลแบบไม่ต่อเนื่อง(Discrete Data) ที่มีขนาดแน่นอนซึ่งขนาดดังกล่าวอาจกระโดดไปมาระหว่างค่าสองค่า คือ สัญญาณระดับสูงสุดและสัญญาณระดับต่ำสุด ซึ่งสัญญาณดิจิตอลนี้เป็นสัญญาณที่คอมพิวเตอร์ใช้ในการทำงานและติดต่อสื่อสารกันเป็นค่าของเลขลงตัว โดยปกติมักแทนด้วย ระดับแรงดันที่แสดงสถานะเป็น "0" และ "1" หรืออาจจะมีหลายสถานะ ซึ่งจะกล่าวถึงในเรื่องระบบสื่อสารดิจิตอล มีค่าที่ตั้งไว้ (threshold) เป็นค่าบอกสถานะ ถ้าสูงเกินค่าที่ตั้งไว้สถานะเป็น "1" ถ้าต่ำกว่าค่าที่ตั้งไว้ สถานะเป็น "0" ซึ่งมีข้อดีในการท่าให้เกิดความผิดพลาดน้อยลง




ประเภทของเครือข่ายคอมพิวเตอร์

         เครือข่ายสามารถจำแนกออกได้ หลายประเภทแล้วแต่เกณฑ์ที่ใช้ เช่น ขนาด ลักษณะการแลกเปลี่ยนข้อมูลของคอมพิวเตอร์ เป็นต้น โดยทั่วไปการจำแนกประเภทของเครือข่ายมีอยู่ วิธีคือ
Personal Area Network (PAN)
คือเทคโนโลยีการเข้าถึงไร้สายในพื้นที่เฉพาะส่วนบุคคล โดยมีระยะทางไม่เกิน 1
เมตร และมีอัตราการรับส่งข้อมูลความเร็วสูงมาก (สูงถึง 480 Mbps) ซึ่งเทคโนโลยีที่ใช้
กันแพร่หลาย


LAN (Local Area Network): ระบบเครือข่ายระดับท้องถิ่น
         เป็นระบบเครือข่ายที่ใช้งานอยู่ในบริเวณที่ ไม่กว้างนัก     อาจใช้อยู่ภายในอาคารเดียวกันหรืออาคารที่อยู่ใกล้กัน เช่น  ภายในมหาวิทยาลัย  อาคารสำนักงาน  คลังสินค้า หรือโรงงาน เป็นต้น  การส่งข้อมูลสามารถทำได้ด้วยความเร็วสูง และมีข้อผิดพลาดน้อย ระบบเครือข่ายระดับท้องถิ่นจึงถูกออกแบบมาให้ช่วยลดต้นทุนและเพื่อเพิ่ม ประสิทธิภาพในการทำงาน และใช้งานอุปกรณ์ต่าง ๆ ร่วมกัน

MAN (Metropolitan Area Network): ระบบเครือข่ายระดับเมือง 
         เป็นระบบเครือข่ายที่มีขนาดอยู่ระหว่าง Lan และ Wan เป็นระบบเครือข่ายที่ใช้ภายในเมืองหรือจังหวัดเท่านั้น การเชื่อมโยงจะต้องอาศัยระบบบริการเครือข่ายสาธารณะ จึงเป็นเครือข่ายที่ใช้กับองค์การที่มีสาขาห่างไกลและต้องการเชื่อมสาขา เหล่านั้นเข้าด้วยกัน เช่น ธนาคาร   เครือข่ายแวนเชื่อมโยงระยะไกลมาก จึงมีความเร็วในการสื่อสารไม่สูง เนื่องจากมีสัญญาณรบกวนในสาย เทคโนโลยีที่ใช้กับเครือข่ายแวนมีความหลากหลาย มีการเชื่อมโยงระหว่างประเทศด้วยช่องสัญญาณดาวเทียม เส้นใยนำแสง คลื่นไมโครเวฟ คลื่นวิทยุ สายเคเบิล

WAN (Wide Area Network): ระบบเครือข่ายระดับประเทศ หรือเครือข่ายบริเวณกว้าง
         เป็นระบบเครือข่ายที่ติดตั้งใช้งานอยู่ในบริเวณกว้าง เช่น ระบบเครือข่ายที่ติดตั้งใช้งานทั่วโลก เป็นเครือข่ายที่เชื่อมต่อคอมพิวเตอร์หรืออุปกรณ์ที่อยู่ห่างไกลกันเข้าด้วย กัน อาจจะต้องเป็นการติดต่อสื่อสารกันในระดับประเทศ ข้ามทวีปหรือทั่วโลกก็ได้ ในการเชื่อมการติดต่อนั้น จะต้องมีการต่อเข้ากับระบบสื่อสารขององค์การโทรศัพท์หรือการสื่อสารแห่ง ประเทศไทยเสียก่อน เพราะจะเป็นการส่งข้อมูลผ่านสายโทรศัพท์ในการติดต่อสื่อสารกันโดยปกติมี อัตราการส่งข้อมูลที่ต่ำและมีโอกาสเกิดข้อผิดพลาด การส่งข้อมูลอาจใช้อุปกรณ์ในการสื่อสาร เช่น โมเด็ม (Modem) มาช่วย

PAN (Personal Area Network)
         PAN คือ "ระบบการติดต่อสื่อสารไร้สายส่วนบุคคล" ย่อมาจาก Personal Area Network หรือเรียกว่า BluetoothPersonal Area Network (PAN)คือเทคโนโลยีการเข้าถึงไร้สายในพื้นที่เฉพาะส่วนบุคคล โดยมีระยะทางไม่เกิน เมตร และมีอัตราการรับส่งข้อมูลความเร็วสูงมาก (สูงถึง 480 Mbps) ซึ่งเทคโนโลยีที่ใช้ กันแพร่หลาย


อุปกรณ์ที่ใช้เป็นตัวกลาง

อุปกรณ์ที่ใช้เป็นตัวกลาง (Transmission Media)

Twisted-Pair Wire (STP และ UTP)
         เป็นสายลวดทองแดงสองเส้นนำมาพันเกลียวเข้าด้วยกันเพื่อทำให้เกิดเป็นสนามแม่เหล็ก ซึ่งใช้ลดสัญญาณรบกวนจากภายนอกเส้นลวด
         - Unshielded twisted pair (UTP): ไม่มีฉนวนหุ้ม
         Shielded twisted pair (STP) has an extra layer of insulation: มีการเพิ่มฉนวนป้องกัน      สัญญาณรบกวนจากคลื่นแม่เหล็กไฟฟ้าต่างๆ
         มีหลายประเภท ปัจจุบันที่ใช้กัน มากคือ Category 5 (CAT5) และ Category 5e (CAT5e) เนื่องจาก รองรับการส่งข้อมูลได้ 100 Mbps และ 1000 Mbps



สายโคแอกเซียล (Coaxial Cables)
         เป็นสายเส้นเดียวมีลวดทองแดงเป็น แกนกลางหุ้มด้วยฉนวนสายยาง มีลวดถักหุ้มฉนวนสายยางอีกชั้น (shield) ป้องกันสัญญาณรบกวน
         มีความเร็วในการส่งข้อมูลต่ำากว่า สายแบบ UTP
         ส่วนมากจะใช้งานบนระบบ Ethernet โดยที่ปลายสายทั้ง ด้าน จะต้องมีตัว terminator ปิดด้วย



ใยแก้วนำแสง (Optical Fibers)
         เป็นตัวกลางของสัญญาณแสงชนิดหนึ่งที่ทำมาจากแก้ว ซึ่งมีความบริสุทธิ์สูงมาก เส้ใยแก้วนำแสงมีลักษณะเป็นเส้นยาวขนาดเล็กมีขนาดประมาณเส้นผมของมนุษย์เรา เส้นใยแก้วนำแสงที่ดีต้องสามารถนำสัญญาณแสงจากจุดหนึ่งไปยังอีกจุดหนึ่งได้ โดยมีการสูญเสียของสัญญาณ แสงน้อยมาก

วันศุกร์ที่ 5 ตุลาคม พ.ศ. 2561

บทที่4 ฐานข้อมูลและ ระบบข้อมูล

ปัญหาในการจัดการทรัพยากรข้อมูลในสภาพแวดล้อมแบบดั้งเดิมคืออะไร?

  • ระบบข้อมูลที่มีประสิทธิภาพให้ผู้ใช้ถูกต้องทันเวลาและข้อมูลที่เกี่ยวข้อง
  • ข้อมูลที่ถูกต้องปราศจากข้อผิดพลาด
  • ข้อมูลที่เป็นประโยชน์สำหรับผู้มีอำนาจตัดสินใจเมื่อจำเป็น
  • ข้อมูลที่เกี่ยวข้องมีความเกี่ยวข้องเมื่อเป็นประโยชน์และเหมาะสมกับประเภทของงานและการตัดสินใจที่ต้องการมัน
  • คุณอาจจะประหลาดใจที่ได้รู้ว่าหลายธุรกิจไม่มีข้อมูลที่ทันเวลาถูกต้องหรือมีความเกี่ยวข้องเนื่องจากข้อมูลในระบบสารสนเทศของพวกเขาได้รับจัดและบำรุงรักษาได้ไม่ดี
เงื่อนไขการจัดองค์กรและแนวคิด
  • ระบบคอมพิวเตอร์จัดข้อมูลในลำดับชั้นที่เริ่มต้นด้วยบิตและไบต์และดำเนินไปยังเขตข้อมูล,ระเบียน, ไฟล์และฐานข้อมูล 
  • บิตแสดงถึงหน่วยข้อมูลที่เล็กที่สุดที่คอมพิวเตอร์สามารถทำได้handle กลุ่มของบิตที่เรียกว่า byte หมายถึง singleตัวอักษรซึ่งอาจเป็นตัวอักษรตัวเลขหรืออีกตัวก็ได้สัญลักษณ์. การจัดกลุ่มตัวอักษรเป็นคำกลุ่มหนึ่งคำหรือหมายเลขที่สมบูรณ์ (เช่นชื่อบุคคลหรืออายุ) เรียกว่าเขตข้อมูลกลุ่มของฟิลด์ที่เกี่ยวข้องเช่นชื่อนักเรียน, หลักสูตร, วันที่, และเกรดประกอบด้วยบันทึก; กลุ่มของระเบียนเดียวกันtype เรียกว่าไฟล์
ผลการค้นหารูปภาพสำหรับ the data hierarchy
  • ระบบคอมพิวเตอร์จัดข้อมูลใน ลำดับชั้นที่เริ่มต้นกับบิตซึ่งหมายถึง 0 หรือ1 อาจจัดกลุ่มเป็นไบต์เพื่อเป็นตัวแทนตัวอักษรตัวเลขหรือสัญลักษณ์ ไบต์สามารถจัดกลุ่มเป็นฟิลด์ และฟิลด์ที่เกี่ยวข้องสามารถจัดกลุ่มเป็นรีคอร์ด ถูกรวบรวมเพื่อจัดรูปแบบเป็นไฟล์ และไฟล์ที่เกี่ยวข้องสามารถจัดเป็น ฐานข้อมูล

ปัญหาเกี่ยวกับสภาพแวดล้อมแบบดั้งเดิม


  • ข้อมูลซ้ำซ้อนและไม่สอดคล้องกัน
  • ความซ้ำซ้อนของข้อมูลคือการมีข้อมูลซ้ำในระบบไฟล์ข้อมูลหลายชุดเพื่อเก็บข้อมูลเดียวกันมากกว่าหนึ่งสถานที่หรือสถานที่ซึ่งนำไปสู่ของเสียทรัพยากรการจัดเก็บ
  • ข้อมูลไม่สอดคล้องกันคือแอตทริบิวต์เดียวกันอาจมีค่าที่แตกต่างกันและยังนำโดยข้อมูลซ้ำซ้อน
  • การใช้วิธีการดั้งเดิมในการประมวลผลไฟล์จะช่วยสนับสนุนแต่ละพื้นที่ทำงานใน บริษัท ที่จะพัฒนาเฉพาะการใช้งาน แต่ละแอ็พพลิเคชันต้องการไฟล์ข้อมูลที่ไม่ซ้ำกันนำไปสู่ข้อมูลซ้ำซ้อนและไม่สอดคล้องกันการประมวลผลความยืดหยุ่นและสูญเสียทรัพยากรการจัดเก็บข้อมูล
  • โปรแกรมขึ้นอยู่กับข้อมูล
  • การพึ่งพาข้อมูลโปรแกรมหมายถึงการมีเพศสัมพันธ์ของข้อมูลเก็บไว้ในไฟล์และโปรแกรมเฉพาะที่ต้องการอัปเดตและบำรุงรักษาไฟล์เหล่านั้นซึ่งจะมีการเปลี่ยนแปลงโปรแกรมต้องมีการเปลี่ยนแปลงข้อมูล ในไฟล์แบบดั้งเดิมสภาพแวดล้อมการเปลี่ยนแปลงใด ๆ ในโปรแกรมซอฟต์แวร์ได้ต้องการการเปลี่ยนแปลงข้อมูลที่เข้าถึงโดยโปรแกรมนั้น
  • ขาดความยืดหยุ่น
  • ระบบไฟล์แบบดั้งเดิมสามารถจัดกำหนดการตามกำหนดเวลาได้รายงานหลังจากความพยายามในการเขียนโปรแกรมที่กว้างขวาง แต่ไม่สามารถส่งรายงานเฉพาะกิจหรือตอบสนองต่อความคาดหมายได้ความต้องการข้อมูลได้ทันท่วงที
  • การรักษาความปลอดภัยที่ไม่ดี
  • การจัดการข้อมูลอาจไม่มีทางรู้ได้ว่าเป็นใครเข้าถึงหรือแม้แต่การเปลี่ยนแปลงองค์กรข้อมูล.
  • ขาดการแบ่งปันข้อมูลและการใช้งาน
  • หากผู้ใช้พบค่าที่แตกต่างกันของชิ้นส่วนเดียวกันข้อมูลในสองระบบที่แตกต่างกันพวกเขาอาจไม่ต้องการใช้ระบบเหล่านี้เพราะพวกเขาไม่สามารถไว้ใจได้ความถูกต้องของข้อมูล
ฐานข้อมูลและระบบจัดการฐานข้อมูล (DBMS) คืออะไร ?
  • ฐานข้อมูลคือชุดของข้อมูลที่จัดให้บริการแอพพลิเคชันหลายอย่างได้ผลโดยรวมข้อมูลและการควบคุมข้อมูลที่ซ้ำซ้อน แทนที่จะเก็บข้อมูลไว้ในไฟล์แยกต่างหากสำหรับแต่ละแอ็พพลิเคชันข้อมูลจะปรากฏต่อผู้ใช้เป็นฐานข้อมูลเดียวที่เก็บไว้ในฐานข้อมูลเดียวบริการหลาย
  • ระบบจัดการฐานข้อมูล เป็นซอฟต์แวร์ที่อนุญาตให้องค์กรสามารถรวมศูนย์ข้อมูลจัดการได้พวกเขาได้อย่างมีประสิทธิภาพและให้การเข้าถึงข้อมูลที่เก็บไว้โดยโปรแกรมประยุกต์ DBMS ทำหน้าที่เป็นอินเทอร์เฟซระหว่างโปรแกรมประยุกต์กับไฟล์ข้อมูลทางกายภาพ
ทำไม DBMS เชิงสัมพันธ์จึงมีประสิทธิภาพ ?
  • ประเภท DBMS ที่เป็นที่นิยมที่สุดในปัจจุบันสำหรับเครื่องพีซีเช่นเดียวกับสำหรับคอมพิวเตอร์ขนาดใหญ่และเมนเฟรมเป็นเรื่องเกี่ยวกับDBMS
  • ฐานข้อมูลเชิงสัมพันธ์แสดงข้อมูลเป็นแบบสองมิติตาราง (เรียกว่าความสัมพันธ์)
  • ตารางหรือความสัมพันธ์อาจเรียกว่าไฟล์ แต่ละตารางมีข้อมูลเกี่ยวกับเอนทิตีและแอตทริบิวต์
  • MicrosoftAccess เป็น DBMS เชิงสัมพันธ์สำหรับเดสก์ท็อปในขณะที่ DB2, Oracle Database และ Microsoft SQL Server เป็น DBMS เชิงสัมพันธ์สำหรับเมนเฟรมขนาดใหญ่และคอมพิวเตอร์ขนาดกลาง MySQL เป็นโอเพนซอร์สที่ได้รับความนิยม DBMS

  • ฐานข้อมูลเชิงสัมพันธ์จัดข้อมูลในรูปแบบของสอง -ตารางมิติ ภาพประกอบที่นี่คือตารางสำหรับเอนทิตี SUPPLIER และ PART แสดงให้เห็นว่าพวกเขาเป็นตัวแทนของแต่ละองค์กรอย่างไรและคุณลักษณะของมัน Supplier_Number เป็นคีย์หลักสำหรับตาราง SUPPLER และคีย์ต่างประเทศสำหรับตาราง PART
ฐานข้อมูลที่ไม่ใช่เชิงสัมพันธ์และฐานข้อมูลในระบบคลาวด์
  • กว่า 30 ปีเทคโนโลยีฐานข้อมูลเชิงสัมพันธ์มีเป็นมาตรฐานทองคำ
  • Cloud computing ปริมาณข้อมูลเป็นประวัติการณ์มหาศาลปริมาณงานสำหรับบริการเว็บ บริษัท หันมา "NoSQL" ไม่ใช่ฐานข้อมูลเชิงสัมพันธ์สำหรับเทคโนโลยีนี้วัตถุประสงค์
  • ระบบจัดการฐานข้อมูลที่ไม่ใช่เชิงสัมพันธ์ใช้รูปแบบข้อมูลที่มีความยืดหยุ่นมากขึ้นและได้รับกาออกแบบสำหรับการจัดการชุดข้อมูลขนาดใหญ่ในเครื่องกระจายหลายเครื่องและสำหรับปรับขนาดได้ง่ายขึ้นหรือลงพวกเขามีประโยชน์สำหรับการเร่งแบบสอบถามง่ายๆกับไดรฟ์ข้อมูลขนาดใหญ่ที่มีโครงสร้างและข้อมูลที่ไม่มีโครงสร้าง, includingWeb, สื่อสังคมออนไลน์, กราฟิก,และข้อมูลอื่น ๆ ที่ยากต่อการวิเคราะห์ด้วยเครื่องมือ SQL แบบดั้งเดิม
  • มีฐานข้อมูล NoSQL หลายแบบซึ่งแต่ละคุณลักษณะและลักษณะทางเทคนิคของตนเอง ฐานข้อมูล Oracle NoSQL เป็นตัวอย่างหนึ่งเช่นเดียวกับ SimpleDB ของ Amazon ซึ่งเป็นหนึ่งในบริการแอมซาโมไซต์ที่ทำงานในระบบคลาวด์ SimpleDB จัดเตรียมอินเทอร์เฟซ Web services ที่เรียบง่ายเพื่อสร้างและเก็บข้อมูลหลายชุดข้อมูลแบบสอบถามได้อย่างง่ายดายและส่งคืนผลลัพธ์ไม่จำเป็นต้องกำหนดโครงสร้างฐานข้อมูลล่วงหน้าอย่างเป็นทางการหรือเปลี่ยนนิยามนั้นหากมีการเพิ่มข้อมูลใหม่ในภายหลัง
  • บริการจัดการข้อมูลบนระบบคลาวด์มีการอุทธรณ์เป็นพิเศษสำหรับการเริ่มต้นธุรกิจที่เน้นการสร้างรายได้หรือธุรกิจขนาดเล็กถึงขนาดกลางที่แสวงหาขีดความสามารถด้านฐานข้อมูลในราคาที่ต่ำกว่าผลิตภัณฑ์ฐานข้อมูลภายใน
ความสามารถของฐานข้อมูลระบบการจัดการ
  • DBMS มีความสามารถและเครื่องมือสำหรับการจัดการจัดการและการเข้าถึงข้อมูลในฐานข้อมูลสิ่งที่สำคัญที่สุดคือภาษาข้อมูลคำอธิบายข้อมูลและภาษาการจัดการข้อมูล
  • การสืบค้นและการรายงาน
  • DBMS มีเครื่องมือสำหรับการเข้าถึงและจัดการข้อมูลในฐานข้อมูล ภาษาการจัดการข้อมูลถูกใช้เพื่อเพิ่มแก้ไขลบและดึงข้อมูลในฐานข้อมูล


แผนผังความสัมพันธ์และความสัมพันธ์เชิงนิติบุคคล

  • การออกแบบฐานข้อมูล
  • ฐานข้อมูลจำเป็นต้องใช้ทั้งการออกแบบแนวคิดและการออกแบบทางกายภาพการออกแบบฐานข้อมูลเป็นแนวคิดเชิงแนวคิดหรือตรรกะเป็นรูปแบบนามธรรมของฐานข้อมูลจากมุมมองทางธุรกิจในขณะที่การออกแบบทางกายภาพแสดงให้เห็นว่าฐานข้อมูลเป็นจริงในการจัดเก็บข้อมูลแบบตรงอย่างไร
  • การสร้างแบบจำลองเป็นกระบวนการสร้างโครงสร้างข้อมูลขนาดเล็กเสถียรและมีความยืดหยุ่นและปรับตัวได้จากกลุ่มข้อมูลที่ซับซ้อนเรียกว่า
  • Entity-Relationship Diagram (ERD) เป็นแบบข้อมูลที่นักออกแบบฐานข้อมูลจัดทำเอกสารรูปแบบข้อมูลของตนแผนผัง ER แสดงความสัมพันธ์ระหว่างเอนทิตีในฐานข้อมูล

อะไรคือเครื่องมือหลักและเทคโนโลยีสำหรับการเข้าถึงข้อมูลจากฐานข้อมูลเพื่อปรับปรุงประสิทธิภาพและการตัดสินใจทางธุรกิจ?
  • ธุรกิจใช้ฐานข้อมูลเพื่อติดตามธุรกรรมพื้นฐานและต้องมีฐานข้อมูลเพื่อให้ข้อมูลที่จะช่วยให้ บริษัท ดำเนินธุรกิจได้อย่างมีประสิทธิภาพมากขึ้นและช่วยให้ผู้จัดการและพนักงานสามารถตัดสินใจได้ดียิ่งขึ้น
  • ข้อมูลส่วนใหญ่ที่รวบรวมโดยองค์กรที่ใช้เป็นข้อมูลธุรกรรมที่สามารถพอดีกับแถวและคอลัมน์ของระบบการจัดการฐานข้อมูลเชิงสัมพันธ์ขณะนี้เรากำลังเป็นพยานการระเบิดข้อมูลจากการเข้าชมเว็บข้อความอีเมลและเนื้อหาโซเชียลมีเดีย (ทวีตข้อความสถานะ) หรือจากระบบการซื้อขายทางอิเล็กทรอนิกส์
  • ข้อมูลเหล่านี้อาจไม่มีโครงสร้างหรือกึ่งโครงสร้างดังนั้นจึงไม่เหมาะสำหรับผลิตภัณฑ์ฐานข้อมูลเชิงสัมพันธ์ที่จัดระเบียบข้อมูลในรูปแบบของคอลัมน์และแถว
ความท้าทายของข้อมูลขนาดใหญ่
  • ตอนนี้เราใช้ข้อมูลขนาดใหญ่เพื่ออธิบายชุดข้อมูลเหล่านี้พร้อมกับไดรฟ์ข้อมูลที่ใหญ่เกินกว่าที่ DBMS ทั่วไปจะสามารถจับเก็บและวิเคราะห์ได้
  • ข้อมูลขนาดใหญ่มักหมายถึงข้อมูลในช่วงของ petabyte และ exabyte หรืออีกนัยหนึ่งนั่นคือพันล้านล้านรายการจากแหล่งข้อมูลอื่น ข้อมูลขนาดใหญ่ผลิตในปริมาณที่มากขึ้นและมากขึ้นอย่างรวดเร็วกว่าข้อมูลแบบเดิม
  • ธุรกิจมีความสนใจในข้อมูลขนาดใหญ่เนื่องจากสามารถเปิดเผยรูปแบบและความผิดปกติที่น่าสนใจมากกว่าชุดข้อมูลขนาดเล็กที่มีศักยภาพในการให้ข้อมูลเชิงลึกใหม่เกี่ยวกับพฤติกรรมของลูกค้ารูปแบบสภาพอากาศการทำตลาดการเงินหรือปรากฏการณ์อื่น ๆ
  • ธุรกิจมีความสนใจในข้อมูลขนาดใหญ่เพราะสามารถเปิดเผยรูปแบบและความผิดปกติที่น่าสนใจมากขึ้นด้วยศักยภาพในการให้ข้อมูลเชิงลึกใหม่เกี่ยวกับพฤติกรรมของลูกค้ารูปแบบสภาพอากาศการทำตลาดการเงินหรือปรากฏการณ์อื่น ๆ
โครงสร้างทางความคิดทางธุรกิจ

  • คลังข้อมูลและคลังข้อมูลขนาดเล็ก
  • คลังข้อมูลเป็นฐานข้อมูลที่เก็บข้อมูลปัจจุบันและข้อมูลทางประวัติศาสตร์ที่น่าสนใจสำหรับผู้มีอำนาจตัดสินใจทั่วทั้งคลังสินค้าคลังข้อมูลจะสกัดข้อมูลปัจจุบันและข้อมูลประวัติจากระบบปฏิบัติการหลายระบบและปรับโครงสร้างข้อมูลเพื่อการรายงานและการจัดการ
  • ข้อมูลดาต้ามาร์กเป็นส่วนย่อยของคลังข้อมูลซึ่งข้อมูลข้อมูลขององค์กรที่สรุปหรือเน้นมากจะอยู่ในฐานข้อมูลที่แยกต่างหากสำหรับประชากรเฉพาะของผู้ใช้
  • Hadoop
  • Hadoop เป็นกรอบซอฟต์แวร์ซอฟต์แวร์โอเพนซอร์สที่ได้รับการจัดการโดย Apache Software Foundation ซึ่งจะช่วยให้สามารถประมวลผลแบบขนานในปริมาณข้อมูลจำนวนมากทั่วทั้งคอมพิวเตอร์ที่ไม่แพง แบ่งปัญหาข้อมูลขนาดใหญ่ออกเป็นปัญหาย่อยกระจายไปยังโหนดการประมวลผลคอมพิวเตอร์ที่มีราคาไม่แพงนับพันรายการจากนั้นรวมผลลัพธ์ไว้ในชุดข้อมูลขนาดเล็กที่สามารถวิเคราะห์ได้ง่ายขึ้น
  • คอมพิวเตอร์ในหน่วยความจำ
  • การประมวลผลในหน่วยความจำทำให้ชุดข้อมูลจำนวนมากมีขนาดใหญ่พอสมควรกับขนาดของข้อมูลหรือคลังข้อมูลขนาดเล็กเพื่อให้อยู่ในหน่วยความจำทั้งหมด ธุรกิจที่ซับซ้อน
  • การคำนวณที่ใช้เวลาหลายชั่วโมงหรือหลายวันสามารถทำได้ภายในไม่กี่วินาทีและสามารถทำได้แม้กระทั่งบนอุปกรณ์พกพา (ดูเซสชันเชิงโต้ตอบเกี่ยวกับเทคโนโลยี)
  • โครงสร้างพื้นฐานธุรกิจอัจฉริยะร่วมสมัยมีความสามารถและเครื่องมือในการจัดการและวิเคราะห์ข้อมูลจำนวนมากและข้อมูลประเภทต่างๆจากหลายแหล่ง เครื่องมือค้นหาและการรายงานที่ใช้งานง่ายสำหรับผู้ใช้ทางธุรกิจแบบสบาย ๆ และเครื่องมือการวิเคราะห์ที่มีความซับซ้อนสำหรับผู้ใช้ที่มีอำนาจสูงจะรวมอยู่ด้วย