Q2. 請詳述下列名詞的主要差異:資料庫 (database)、資料倉儲 (data warehouse)、資料探勘 (data mining)、資料結構 (data structure)、大數據 (big data)。
1️⃣ 資料庫 (Database)
-
定義:
資料的集中存放與管理系統,用來 儲存、查詢、修改與維護日常營運資料。 -
特點:
-
強調 即時性(例如銀行交易、醫院病歷)。
-
使用 資料庫管理系統 (DBMS) 如 MySQL、PostgreSQL、Oracle。
-
資料通常是結構化的(表格形式)。
-
-
應用情境:需要儲存大量資料的系統,例如,:差假系統、電子商務、醫院資訊系統。
2️⃣ 資料倉儲 (Data Warehouse)
-
定義:
專門為 分析與決策 設計的大型資料庫,會將不同來源的資料整合後,進行清理、轉換,再集中儲存。 -
特點:
-
偏重 歷史資料(不是即時交易)。
-
經過 ETL 流程(Extract, Transform, Load)整理過。
-
適合 報表分析、商業智慧 (BI)、趨勢預測。
-
-
應用情境:銷售趨勢分析、財務報表彙整、企業決策支持系統。
3️⃣ 資料探勘 (Data Mining)
-
定義:
在大量資料中,透過演算法 發現隱藏的模式與知識 的過程。 -
特點:
-
結合 統計學、機器學習與人工智慧 技術。
-
著重在 找出規律、預測未來。
-
屬於資料分析的一部分。
-
-
應用情境:信用卡詐欺偵測、客戶行為分析、推薦系統(如 Netflix、蝦皮推薦)。
4️⃣ 資料結構 (Data Structure)
-
定義:
程式設計中 組織與儲存資料的方法,確保資料存取與運算更有效率。 -
特點:
-
屬於 電腦科學的基本概念。
-
常見種類:陣列 (Array)、鏈結串列 (Linked List)、堆疊 (Stack)、佇列 (Queue)、樹 (Tree)、圖 (Graph)、雜湊表 (Hash Table)。
-
-
應用情境:演算法設計、程式效率優化、搜尋與排序。
5️⃣ 大數據 (Big Data)
-
定義:
指 龐大且多樣化的資料集合,傳統資料庫系統無法有效處理,需要特殊技術(如分散式計算)。 -
特點:常以 5V 描述:
-
Volume(大量)
-
Velocity(高速產生)
-
Variety(多樣型態:文字、影像、影音、感測器資料)
-
Veracity(真實性、可靠性)
-
Value(價值萃取)
-
-
應用情境:社群媒體分析、IoT 物聯網資料處理、醫療大數據、智慧城市。
沒有留言:
張貼留言