Khai Phá Dữ Liệu Là Gì? Tại Sao Phải Tiến Hành Khai Phá Dữ Liệu?

  1. Trang chủ >
  2. Luận Văn - Báo Cáo >
  3. Công nghệ thông tin >
Khai phá dữ liệu là gì? Tại sao phải tiến hành khai phá dữ liệu?

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.09 MB, 62 trang )

http:etrithuc.vnChương 1: Giới thiệu về khai phá dữ liệu1.1. Khai phá dữ liệu là gì?Có khá nhiều ñịnh nghĩa về khai phá dữ liệu Data mining, nhưng ñịnh nghĩa ñơn giản nhất thì khai phá dữ liệu là việc trích rút thơng tin hay tri thức mới và có ích từnguồn dữ liệu khổng lồ .Ngồi ra, khai phá dữ liệu còn có thể hiểu là trích rút các thơng tin có ích từ những dữ liệu khơng tường minh, hoặc trích rút lấy những thông tin không biết trước và tiềm tàngtrong dữ liệu. Cũng có thể hiểu, khai phá dữ liệu là việc phân tích khảo sát một cách tỉ mỉ số lượng lớn dữ liệu bằng các phương pháp tự ñộng hoặc bán tự động nhằm tìm ra cácmẫu có ích. Có thể nhận xét rằng, khái niệm khai phá dữ liệu là khá rộng lớn, nhưng không phảitất cả mọi công việc liên quan ñến dữ liệu ñều ñược coi là khai phá dữ liệu, chẳng hạn như những việc xử lý truy vấn ñơn giản như tra cứu một số ñiện thoại, hay thống kê ranhững học sinh giỏi của một lớp, thì khơng thể coi đó là khai phá dữ liệu. Nhưng những cơng việc như gom nhóm các tài liệu trả về từ máy tìm kiếm theo từng ngữ cảnh thì lạiđượ c xem là khai phá dữ liệu.1.2. Tại sao phải tiến hành khai phá dữ liệu?Trong những năm gần ñây, khai phá dữ liệu trở thành một lĩnh vực nghiên cứu rộng rãi trong ngành công nghiệp thông tin, nguyên nhân chủ yếu là do khối lượng khổng lồcủa dữ liệu mà con người tạo ra, ñi kèm với nó là sự cần thiết biến ñổi những dữ liệu đó thành tri thức. Thơng tin và tri thức có thể được áp dụng vào nhiều lĩnh vực từ phân tíchthị trường tài chính, phát hiện giả mạo, cho ñến ñiều khiển sản xuất và nghiên cứu khoa học.http:etrithuc.vnNhìn vào hai lĩnh vực sinh ra nhiều dữ liệu nhất đó là thương mại và khoa học. Trong lĩnh vực thương mại, hàng ngày hàng giờ con người ñang tạo ra, thu thập và lưu trữ lại rấtnhiều dữ liệu, như dữ liệu web, dữ liệu về thương mại điện tử, dữ liệu về việc thanh tốn tại các cửa hàng và các dữ liệu thanh toán trong các tài khoản… Tính cạnh tranh trongkinh doanh là rất cao, cho nên việc phân tích dữ liệu ñể cung cấp dịch vụ tốt hơn, có nhiều tiện ích cho khách hàng, và đón bắt chính xác nhu cầu của khách hàng rất quantrọng. Trong lĩnh vực khoa học, dường như lượng dữ liệu sinh ra và thu thập lại còn lớn hơn nhiều, lên tới hàng GBgiờ, chẳng hạn như dữ liệu từ vệ tinh, từ các ảnh chụp vũ trụvà từ các mô phỏng thử nghiệm khoa học. Khai phá dữ liệu giúp các nhà khoa học trong việc phân lớp dữ liệu và hỗ trợ trong việc ñưa ra các quyết ñịnh.Cùng với sự phát triển của khoa học, của ngành cơ sở dữ liệu khơng thể khơng kể đến là sự phát triển của ngành cơng nghiệp máy tính, người ta ñã tạo ra những phương tiệnlưu trữ lớn hơn, những máy tính rẻ hơn, tốc độ cao hơn, trợ giúp cho quá trình thu thập dữ liệu cũng như khai phá chúng.Trong quá trình tác nghiệp, người ta thường phải ñưa ra các quyết ñịnh, tuy nhiên, với lượng dữ liệu khổng lồ như thế, người ta không thể sử dụng hết, hoặc nếu muốn sử dụngthì phải mất thời gian q nhiều, như vậy có nguy cơ đánh mất cơ hội. Do đó, việc sử dụng máy tính ñể khai phá dữ liệu nhằm giúp ñỡ con người trong cơng việc càng đượcthúc đẩy mạnh mẽ, làm sao với các dữ liệu đã thu thập được có thể ñưa ra một hành ñộng mang lại lợi ích tối ña.

1.3. Quá trình khai phá dữ liệu

Xem Thêm

Tài liệu liên quan

  • Áp dụng phương pháp trích chọn đặc trưng để nâng cao hiệu quả phân lớp khi khai phá dữ liệu lớnÁp dụng phương pháp trích chọn đặc trưng để nâng cao hiệu quả phân lớp khi khai phá dữ liệu lớn
    • 62
    • 1,219
    • 5
Tải bản đầy đủ (.pdf) (62 trang)

Tài liệu bạn tìm kiếm đã sẵn sàng tải về

(1.09 MB) - Áp dụng phương pháp trích chọn đặc trưng để nâng cao hiệu quả phân lớp khi khai phá dữ liệu lớn-62 (trang) Tải bản đầy đủ ngay ×

Từ khóa » Khai Khoáng Dữ Liệu Là Gì