วันศุกร์ที่ 5 ตุลาคม พ.ศ. 2561

บทที่4 ฐานข้อมูลและ ระบบข้อมูล

ปัญหาในการจัดการทรัพยากรข้อมูลในสภาพแวดล้อมแบบดั้งเดิมคืออะไร?

  • ระบบข้อมูลที่มีประสิทธิภาพให้ผู้ใช้ถูกต้องทันเวลาและข้อมูลที่เกี่ยวข้อง
  • ข้อมูลที่ถูกต้องปราศจากข้อผิดพลาด
  • ข้อมูลที่เป็นประโยชน์สำหรับผู้มีอำนาจตัดสินใจเมื่อจำเป็น
  • ข้อมูลที่เกี่ยวข้องมีความเกี่ยวข้องเมื่อเป็นประโยชน์และเหมาะสมกับประเภทของงานและการตัดสินใจที่ต้องการมัน
  • คุณอาจจะประหลาดใจที่ได้รู้ว่าหลายธุรกิจไม่มีข้อมูลที่ทันเวลาถูกต้องหรือมีความเกี่ยวข้องเนื่องจากข้อมูลในระบบสารสนเทศของพวกเขาได้รับจัดและบำรุงรักษาได้ไม่ดี
เงื่อนไขการจัดองค์กรและแนวคิด
  • ระบบคอมพิวเตอร์จัดข้อมูลในลำดับชั้นที่เริ่มต้นด้วยบิตและไบต์และดำเนินไปยังเขตข้อมูล,ระเบียน, ไฟล์และฐานข้อมูล 
  • บิตแสดงถึงหน่วยข้อมูลที่เล็กที่สุดที่คอมพิวเตอร์สามารถทำได้handle กลุ่มของบิตที่เรียกว่า byte หมายถึง singleตัวอักษรซึ่งอาจเป็นตัวอักษรตัวเลขหรืออีกตัวก็ได้สัญลักษณ์. การจัดกลุ่มตัวอักษรเป็นคำกลุ่มหนึ่งคำหรือหมายเลขที่สมบูรณ์ (เช่นชื่อบุคคลหรืออายุ) เรียกว่าเขตข้อมูลกลุ่มของฟิลด์ที่เกี่ยวข้องเช่นชื่อนักเรียน, หลักสูตร, วันที่, และเกรดประกอบด้วยบันทึก; กลุ่มของระเบียนเดียวกันtype เรียกว่าไฟล์
ผลการค้นหารูปภาพสำหรับ the data hierarchy
  • ระบบคอมพิวเตอร์จัดข้อมูลใน ลำดับชั้นที่เริ่มต้นกับบิตซึ่งหมายถึง 0 หรือ1 อาจจัดกลุ่มเป็นไบต์เพื่อเป็นตัวแทนตัวอักษรตัวเลขหรือสัญลักษณ์ ไบต์สามารถจัดกลุ่มเป็นฟิลด์ และฟิลด์ที่เกี่ยวข้องสามารถจัดกลุ่มเป็นรีคอร์ด ถูกรวบรวมเพื่อจัดรูปแบบเป็นไฟล์ และไฟล์ที่เกี่ยวข้องสามารถจัดเป็น ฐานข้อมูล

ปัญหาเกี่ยวกับสภาพแวดล้อมแบบดั้งเดิม


  • ข้อมูลซ้ำซ้อนและไม่สอดคล้องกัน
  • ความซ้ำซ้อนของข้อมูลคือการมีข้อมูลซ้ำในระบบไฟล์ข้อมูลหลายชุดเพื่อเก็บข้อมูลเดียวกันมากกว่าหนึ่งสถานที่หรือสถานที่ซึ่งนำไปสู่ของเสียทรัพยากรการจัดเก็บ
  • ข้อมูลไม่สอดคล้องกันคือแอตทริบิวต์เดียวกันอาจมีค่าที่แตกต่างกันและยังนำโดยข้อมูลซ้ำซ้อน
  • การใช้วิธีการดั้งเดิมในการประมวลผลไฟล์จะช่วยสนับสนุนแต่ละพื้นที่ทำงานใน บริษัท ที่จะพัฒนาเฉพาะการใช้งาน แต่ละแอ็พพลิเคชันต้องการไฟล์ข้อมูลที่ไม่ซ้ำกันนำไปสู่ข้อมูลซ้ำซ้อนและไม่สอดคล้องกันการประมวลผลความยืดหยุ่นและสูญเสียทรัพยากรการจัดเก็บข้อมูล
  • โปรแกรมขึ้นอยู่กับข้อมูล
  • การพึ่งพาข้อมูลโปรแกรมหมายถึงการมีเพศสัมพันธ์ของข้อมูลเก็บไว้ในไฟล์และโปรแกรมเฉพาะที่ต้องการอัปเดตและบำรุงรักษาไฟล์เหล่านั้นซึ่งจะมีการเปลี่ยนแปลงโปรแกรมต้องมีการเปลี่ยนแปลงข้อมูล ในไฟล์แบบดั้งเดิมสภาพแวดล้อมการเปลี่ยนแปลงใด ๆ ในโปรแกรมซอฟต์แวร์ได้ต้องการการเปลี่ยนแปลงข้อมูลที่เข้าถึงโดยโปรแกรมนั้น
  • ขาดความยืดหยุ่น
  • ระบบไฟล์แบบดั้งเดิมสามารถจัดกำหนดการตามกำหนดเวลาได้รายงานหลังจากความพยายามในการเขียนโปรแกรมที่กว้างขวาง แต่ไม่สามารถส่งรายงานเฉพาะกิจหรือตอบสนองต่อความคาดหมายได้ความต้องการข้อมูลได้ทันท่วงที
  • การรักษาความปลอดภัยที่ไม่ดี
  • การจัดการข้อมูลอาจไม่มีทางรู้ได้ว่าเป็นใครเข้าถึงหรือแม้แต่การเปลี่ยนแปลงองค์กรข้อมูล.
  • ขาดการแบ่งปันข้อมูลและการใช้งาน
  • หากผู้ใช้พบค่าที่แตกต่างกันของชิ้นส่วนเดียวกันข้อมูลในสองระบบที่แตกต่างกันพวกเขาอาจไม่ต้องการใช้ระบบเหล่านี้เพราะพวกเขาไม่สามารถไว้ใจได้ความถูกต้องของข้อมูล
ฐานข้อมูลและระบบจัดการฐานข้อมูล (DBMS) คืออะไร ?
  • ฐานข้อมูลคือชุดของข้อมูลที่จัดให้บริการแอพพลิเคชันหลายอย่างได้ผลโดยรวมข้อมูลและการควบคุมข้อมูลที่ซ้ำซ้อน แทนที่จะเก็บข้อมูลไว้ในไฟล์แยกต่างหากสำหรับแต่ละแอ็พพลิเคชันข้อมูลจะปรากฏต่อผู้ใช้เป็นฐานข้อมูลเดียวที่เก็บไว้ในฐานข้อมูลเดียวบริการหลาย
  • ระบบจัดการฐานข้อมูล เป็นซอฟต์แวร์ที่อนุญาตให้องค์กรสามารถรวมศูนย์ข้อมูลจัดการได้พวกเขาได้อย่างมีประสิทธิภาพและให้การเข้าถึงข้อมูลที่เก็บไว้โดยโปรแกรมประยุกต์ DBMS ทำหน้าที่เป็นอินเทอร์เฟซระหว่างโปรแกรมประยุกต์กับไฟล์ข้อมูลทางกายภาพ
ทำไม DBMS เชิงสัมพันธ์จึงมีประสิทธิภาพ ?
  • ประเภท DBMS ที่เป็นที่นิยมที่สุดในปัจจุบันสำหรับเครื่องพีซีเช่นเดียวกับสำหรับคอมพิวเตอร์ขนาดใหญ่และเมนเฟรมเป็นเรื่องเกี่ยวกับDBMS
  • ฐานข้อมูลเชิงสัมพันธ์แสดงข้อมูลเป็นแบบสองมิติตาราง (เรียกว่าความสัมพันธ์)
  • ตารางหรือความสัมพันธ์อาจเรียกว่าไฟล์ แต่ละตารางมีข้อมูลเกี่ยวกับเอนทิตีและแอตทริบิวต์
  • MicrosoftAccess เป็น DBMS เชิงสัมพันธ์สำหรับเดสก์ท็อปในขณะที่ DB2, Oracle Database และ Microsoft SQL Server เป็น DBMS เชิงสัมพันธ์สำหรับเมนเฟรมขนาดใหญ่และคอมพิวเตอร์ขนาดกลาง MySQL เป็นโอเพนซอร์สที่ได้รับความนิยม DBMS

  • ฐานข้อมูลเชิงสัมพันธ์จัดข้อมูลในรูปแบบของสอง -ตารางมิติ ภาพประกอบที่นี่คือตารางสำหรับเอนทิตี SUPPLIER และ PART แสดงให้เห็นว่าพวกเขาเป็นตัวแทนของแต่ละองค์กรอย่างไรและคุณลักษณะของมัน Supplier_Number เป็นคีย์หลักสำหรับตาราง SUPPLER และคีย์ต่างประเทศสำหรับตาราง PART
ฐานข้อมูลที่ไม่ใช่เชิงสัมพันธ์และฐานข้อมูลในระบบคลาวด์
  • กว่า 30 ปีเทคโนโลยีฐานข้อมูลเชิงสัมพันธ์มีเป็นมาตรฐานทองคำ
  • Cloud computing ปริมาณข้อมูลเป็นประวัติการณ์มหาศาลปริมาณงานสำหรับบริการเว็บ บริษัท หันมา "NoSQL" ไม่ใช่ฐานข้อมูลเชิงสัมพันธ์สำหรับเทคโนโลยีนี้วัตถุประสงค์
  • ระบบจัดการฐานข้อมูลที่ไม่ใช่เชิงสัมพันธ์ใช้รูปแบบข้อมูลที่มีความยืดหยุ่นมากขึ้นและได้รับกาออกแบบสำหรับการจัดการชุดข้อมูลขนาดใหญ่ในเครื่องกระจายหลายเครื่องและสำหรับปรับขนาดได้ง่ายขึ้นหรือลงพวกเขามีประโยชน์สำหรับการเร่งแบบสอบถามง่ายๆกับไดรฟ์ข้อมูลขนาดใหญ่ที่มีโครงสร้างและข้อมูลที่ไม่มีโครงสร้าง, includingWeb, สื่อสังคมออนไลน์, กราฟิก,และข้อมูลอื่น ๆ ที่ยากต่อการวิเคราะห์ด้วยเครื่องมือ SQL แบบดั้งเดิม
  • มีฐานข้อมูล NoSQL หลายแบบซึ่งแต่ละคุณลักษณะและลักษณะทางเทคนิคของตนเอง ฐานข้อมูล Oracle NoSQL เป็นตัวอย่างหนึ่งเช่นเดียวกับ SimpleDB ของ Amazon ซึ่งเป็นหนึ่งในบริการแอมซาโมไซต์ที่ทำงานในระบบคลาวด์ SimpleDB จัดเตรียมอินเทอร์เฟซ Web services ที่เรียบง่ายเพื่อสร้างและเก็บข้อมูลหลายชุดข้อมูลแบบสอบถามได้อย่างง่ายดายและส่งคืนผลลัพธ์ไม่จำเป็นต้องกำหนดโครงสร้างฐานข้อมูลล่วงหน้าอย่างเป็นทางการหรือเปลี่ยนนิยามนั้นหากมีการเพิ่มข้อมูลใหม่ในภายหลัง
  • บริการจัดการข้อมูลบนระบบคลาวด์มีการอุทธรณ์เป็นพิเศษสำหรับการเริ่มต้นธุรกิจที่เน้นการสร้างรายได้หรือธุรกิจขนาดเล็กถึงขนาดกลางที่แสวงหาขีดความสามารถด้านฐานข้อมูลในราคาที่ต่ำกว่าผลิตภัณฑ์ฐานข้อมูลภายใน
ความสามารถของฐานข้อมูลระบบการจัดการ
  • DBMS มีความสามารถและเครื่องมือสำหรับการจัดการจัดการและการเข้าถึงข้อมูลในฐานข้อมูลสิ่งที่สำคัญที่สุดคือภาษาข้อมูลคำอธิบายข้อมูลและภาษาการจัดการข้อมูล
  • การสืบค้นและการรายงาน
  • DBMS มีเครื่องมือสำหรับการเข้าถึงและจัดการข้อมูลในฐานข้อมูล ภาษาการจัดการข้อมูลถูกใช้เพื่อเพิ่มแก้ไขลบและดึงข้อมูลในฐานข้อมูล


แผนผังความสัมพันธ์และความสัมพันธ์เชิงนิติบุคคล

  • การออกแบบฐานข้อมูล
  • ฐานข้อมูลจำเป็นต้องใช้ทั้งการออกแบบแนวคิดและการออกแบบทางกายภาพการออกแบบฐานข้อมูลเป็นแนวคิดเชิงแนวคิดหรือตรรกะเป็นรูปแบบนามธรรมของฐานข้อมูลจากมุมมองทางธุรกิจในขณะที่การออกแบบทางกายภาพแสดงให้เห็นว่าฐานข้อมูลเป็นจริงในการจัดเก็บข้อมูลแบบตรงอย่างไร
  • การสร้างแบบจำลองเป็นกระบวนการสร้างโครงสร้างข้อมูลขนาดเล็กเสถียรและมีความยืดหยุ่นและปรับตัวได้จากกลุ่มข้อมูลที่ซับซ้อนเรียกว่า
  • Entity-Relationship Diagram (ERD) เป็นแบบข้อมูลที่นักออกแบบฐานข้อมูลจัดทำเอกสารรูปแบบข้อมูลของตนแผนผัง ER แสดงความสัมพันธ์ระหว่างเอนทิตีในฐานข้อมูล

อะไรคือเครื่องมือหลักและเทคโนโลยีสำหรับการเข้าถึงข้อมูลจากฐานข้อมูลเพื่อปรับปรุงประสิทธิภาพและการตัดสินใจทางธุรกิจ?
  • ธุรกิจใช้ฐานข้อมูลเพื่อติดตามธุรกรรมพื้นฐานและต้องมีฐานข้อมูลเพื่อให้ข้อมูลที่จะช่วยให้ บริษัท ดำเนินธุรกิจได้อย่างมีประสิทธิภาพมากขึ้นและช่วยให้ผู้จัดการและพนักงานสามารถตัดสินใจได้ดียิ่งขึ้น
  • ข้อมูลส่วนใหญ่ที่รวบรวมโดยองค์กรที่ใช้เป็นข้อมูลธุรกรรมที่สามารถพอดีกับแถวและคอลัมน์ของระบบการจัดการฐานข้อมูลเชิงสัมพันธ์ขณะนี้เรากำลังเป็นพยานการระเบิดข้อมูลจากการเข้าชมเว็บข้อความอีเมลและเนื้อหาโซเชียลมีเดีย (ทวีตข้อความสถานะ) หรือจากระบบการซื้อขายทางอิเล็กทรอนิกส์
  • ข้อมูลเหล่านี้อาจไม่มีโครงสร้างหรือกึ่งโครงสร้างดังนั้นจึงไม่เหมาะสำหรับผลิตภัณฑ์ฐานข้อมูลเชิงสัมพันธ์ที่จัดระเบียบข้อมูลในรูปแบบของคอลัมน์และแถว
ความท้าทายของข้อมูลขนาดใหญ่
  • ตอนนี้เราใช้ข้อมูลขนาดใหญ่เพื่ออธิบายชุดข้อมูลเหล่านี้พร้อมกับไดรฟ์ข้อมูลที่ใหญ่เกินกว่าที่ DBMS ทั่วไปจะสามารถจับเก็บและวิเคราะห์ได้
  • ข้อมูลขนาดใหญ่มักหมายถึงข้อมูลในช่วงของ petabyte และ exabyte หรืออีกนัยหนึ่งนั่นคือพันล้านล้านรายการจากแหล่งข้อมูลอื่น ข้อมูลขนาดใหญ่ผลิตในปริมาณที่มากขึ้นและมากขึ้นอย่างรวดเร็วกว่าข้อมูลแบบเดิม
  • ธุรกิจมีความสนใจในข้อมูลขนาดใหญ่เนื่องจากสามารถเปิดเผยรูปแบบและความผิดปกติที่น่าสนใจมากกว่าชุดข้อมูลขนาดเล็กที่มีศักยภาพในการให้ข้อมูลเชิงลึกใหม่เกี่ยวกับพฤติกรรมของลูกค้ารูปแบบสภาพอากาศการทำตลาดการเงินหรือปรากฏการณ์อื่น ๆ
  • ธุรกิจมีความสนใจในข้อมูลขนาดใหญ่เพราะสามารถเปิดเผยรูปแบบและความผิดปกติที่น่าสนใจมากขึ้นด้วยศักยภาพในการให้ข้อมูลเชิงลึกใหม่เกี่ยวกับพฤติกรรมของลูกค้ารูปแบบสภาพอากาศการทำตลาดการเงินหรือปรากฏการณ์อื่น ๆ
โครงสร้างทางความคิดทางธุรกิจ

  • คลังข้อมูลและคลังข้อมูลขนาดเล็ก
  • คลังข้อมูลเป็นฐานข้อมูลที่เก็บข้อมูลปัจจุบันและข้อมูลทางประวัติศาสตร์ที่น่าสนใจสำหรับผู้มีอำนาจตัดสินใจทั่วทั้งคลังสินค้าคลังข้อมูลจะสกัดข้อมูลปัจจุบันและข้อมูลประวัติจากระบบปฏิบัติการหลายระบบและปรับโครงสร้างข้อมูลเพื่อการรายงานและการจัดการ
  • ข้อมูลดาต้ามาร์กเป็นส่วนย่อยของคลังข้อมูลซึ่งข้อมูลข้อมูลขององค์กรที่สรุปหรือเน้นมากจะอยู่ในฐานข้อมูลที่แยกต่างหากสำหรับประชากรเฉพาะของผู้ใช้
  • Hadoop
  • Hadoop เป็นกรอบซอฟต์แวร์ซอฟต์แวร์โอเพนซอร์สที่ได้รับการจัดการโดย Apache Software Foundation ซึ่งจะช่วยให้สามารถประมวลผลแบบขนานในปริมาณข้อมูลจำนวนมากทั่วทั้งคอมพิวเตอร์ที่ไม่แพง แบ่งปัญหาข้อมูลขนาดใหญ่ออกเป็นปัญหาย่อยกระจายไปยังโหนดการประมวลผลคอมพิวเตอร์ที่มีราคาไม่แพงนับพันรายการจากนั้นรวมผลลัพธ์ไว้ในชุดข้อมูลขนาดเล็กที่สามารถวิเคราะห์ได้ง่ายขึ้น
  • คอมพิวเตอร์ในหน่วยความจำ
  • การประมวลผลในหน่วยความจำทำให้ชุดข้อมูลจำนวนมากมีขนาดใหญ่พอสมควรกับขนาดของข้อมูลหรือคลังข้อมูลขนาดเล็กเพื่อให้อยู่ในหน่วยความจำทั้งหมด ธุรกิจที่ซับซ้อน
  • การคำนวณที่ใช้เวลาหลายชั่วโมงหรือหลายวันสามารถทำได้ภายในไม่กี่วินาทีและสามารถทำได้แม้กระทั่งบนอุปกรณ์พกพา (ดูเซสชันเชิงโต้ตอบเกี่ยวกับเทคโนโลยี)
  • โครงสร้างพื้นฐานธุรกิจอัจฉริยะร่วมสมัยมีความสามารถและเครื่องมือในการจัดการและวิเคราะห์ข้อมูลจำนวนมากและข้อมูลประเภทต่างๆจากหลายแหล่ง เครื่องมือค้นหาและการรายงานที่ใช้งานง่ายสำหรับผู้ใช้ทางธุรกิจแบบสบาย ๆ และเครื่องมือการวิเคราะห์ที่มีความซับซ้อนสำหรับผู้ใช้ที่มีอำนาจสูงจะรวมอยู่ด้วย

ไม่มีความคิดเห็น:

แสดงความคิดเห็น