Nghiên Cứu Gán Nhãn Từ Loại Cho Văn Bản Tiếng Việt Bằng Phương ...

Tải bản đầy đủ (.pdf) (53 trang)
  1. Trang chủ
  2. >>
  3. Thạc sĩ - Cao học
  4. >>
  5. Khoa học tự nhiên
nghiên cứu gán nhãn từ loại cho văn bản tiếng việt bằng phương pháp học máy không có hướng dẫn

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.65 MB, 53 trang )

1 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN  Trần Thu Trang NGHIÊN CỨU GÁN NHÃN TỪ LOẠI CHO VĂN BẢN TIẾNG VIỆT BẰNG PHƯƠNG PHÁP HỌC MÁY KHÔNG CÓ HƯỚNG DẪN Chuyên nghành: Bảo đảm toán học cho máy tính và hệ thống tính toán Mã số: 60 46 35 TÓM TẮT LUẬN VĂN THẠC SĨ NGƯỜI HƯỚNG DẪN KHOA HỌC: TS. NGUYỄN THỊ MINH HUYỀN Hà Nội – Năm 2012 2 Mục lục LỜI NÓI ĐẦU 5 Chƣơng 1 - TỔNG QUAN 7 1.1 Bài toán gán nhãn từ loại 7 1.2 Tổng quan về cách tiếp cận giải bài toán 7 1.2.1 Quá trình gán nhãn từ loại 7 1.2.2 Ngữ liệu 8 1.2.3 Các tiếp cận giải bài toán 9 1.2.5 Gán nhãn dựa trên luật 10 1.2.6 Gán nhãn thống kê 11 1.2.7 Các từ chƣa biết 12 1.3 Bài toán gán nhãn từ loại tiếng Việt 13 Chƣơng 2 - CƠ SỞ TOÁN HỌC 15 2.1 Định lý Bayes 15 2.2 Thuật toán cực đại hóa kỳ vọng (EM) 16 2.3 Mô hình Markov ẩn 17 2.3.1 Ba bài toán cơ bản của HMM 18 2.2.2 Mô hình n-gram 23 2.4 Phân cụm 23 2.4.1 Khái niệm phân cụm 23 2.4.2 Các yêu cầu của phân cụm 24 2.4.3 Các phƣơng pháp phân cụm 24 2.4.4 Độ đo khoảng cách 26 3 2.5 Phân tích giá trị kỳ dị 27 Chƣơng 3 - MỘT SỐ PHƢƠNG PHÁP TIẾP CẬN KHÔNG CÓ HƢỚNG DẪN CHO GÁN NHÃN TỪ LOẠI 30 3.1 Gán nhãn sử dụng kỹ thuật Cực đại hóa kỳ vọng 30 3.1.1 Huấn luyện mô hình Trigram 31 3.1.2 Kết quả thử nghiệm với tiếng Anh 34 3.1.3 Các thí nghiệm cơ bản 34 3.2 Gán nhãn từ loại bằng kỹ thuật phân cụm 35 3.2.1 Suy luận gán nhãn 36 3.2.2 Suy luận dựa trên từ loại 37 3.2.3 Suy luận dựa trên loại từ và ngữ cảnh 37 3.2.4 Suy luận dựa trên loại từ và ngữ cảnh, sử dụng các véc tơ ngữ cảnh trái và phải tổng quát hoá 38 3.2.5 Các kết quả 39 3.3 Đề xuất phƣơng pháp không hƣớng dẫn cho bài toán gán nhãn từ loại tiếng Việt 40 KẾT LUẬN 48 4 LỜI CẢM ƠN Em xin chân thành cảm ơn các thầy cô giáo trong khoa Toán–Cơ–Tin học đã dạy dỗ và truyền đạt cho em rất nhiều kiến thức trong những năm học vừa qua. Đặc biệt em xin gửi lời cảm ơn tới TS. Nguyễn Thị Minh Huyền đã tận tình chỉ bảo và truyền đạt những kiến thức chuyên ngành trong quá trình em thực hiện luận văn này. Cuối cùng em xin gửi những lời chúc tốt đẹp nhất tới các thầy cô giáo trong khoa, cô Nguyễn Thị Minh Huyền, gia đình và bạn bè những ngƣời đã ủng hộ em trong thời gian vừa qua. 5 LỜI NÓI ĐẦU Một trong các vấn đề nền tảng của ngôn ngữ tự nhiên là việc phân loại các từ thành các lớp từ loại dựa theo thực tiễn hoạt động ngôn ngữ. Mỗi từ loại tƣơng ứng với một lớp từ giữ một vai trò ngữ pháp nhất định. Nói chung, mỗi từ trong một ngôn ngữ có thể gắn với nhiều từ loại, và việc tự động “hiểu” đúng nghĩa một từ phụ thuộc vào việc nó đƣợc xác định đúng từ loại hay không. Công việc gán nhãn từ loại cho một văn bản là xác định từ loại của mỗi từ trong phạm vi văn bản đó. Các công cụ gán nhãn (hay chú thích) từ loại cho các từ trong một văn bản có thể thay đổi tuỳ theo quan niệm về đơn vị từ vựng và thông tin ngôn ngữ cần khai thác trong các ứng dụng cụ thể. Xác định từ loại chính xác cho các từ trong văn bản là vấn đề rất quan trọng trong lĩnh vực xử lý ngôn ngữ tự nhiên. Công cụ gán nhãn từ loại có thể đƣợc ứng dụng rộng rãi trong các hệ thống tìm kiếm thông tin, trong các ứng dụng tổng hợp tiếng nói, các hệ thống nhận dạng tiếng nói cũng nhƣ trong các hệ thống dịch máy. Công cụ này cũng hỗ trợ cho việc phân tích cú pháp các văn bản, góp phần giải quyết tính đa nghĩa của từ, và trợ giúp các hệ hống rút trích thông tin hƣớng đến ngữ nghĩa, v.v… Vấn đề gán nhãn từ loại của nhiều ngôn ngữ đã đƣợc giải quyết tốt bằng phƣơng pháp học máy có hƣớng dẫn, nghĩa là phải xây dựng một kho ngữ liệu huấn luyện lớn và/hoặc xây dựng tập luật để nhận diện từ loại. Hiện nay, bài toán gán nhãn từ loại tiếng Việt cũng đã đƣợc một số nhóm nghiên cứu và giải giải quyết cũng chủ yếu bằng phƣơng pháp học máy có hƣớng dẫn, nhƣng việc xây dựng tập huấn luyện còn gặp nhiều khó khăn vì bản thân các nhà ngôn ngữ học vẫn còn chƣa thống nhất về tập từ loại tiếng Việt nên các nhóm tự định nghĩa tập nhãn khác nhau, và các nhóm cũng tự xây dựng kho 6 dữ liệu đã gán nhãn và xây dựng tập luật khác nhau. Công việc này mất rất nhiều thời gian, tiền của và công sức của các nhà nghiên cứu. Một cách tiếp cận khác cho bài toán gán nhãn từ loại là sử dụng phƣơng pháp học máy không có hƣớng dẫn để một mặt giải quyết vấn đề xác định bộ nhãn từ loại, mặt khác tiết kiệm công sức xây dựng tập huấn luyện. Đề tài này nghiên cứu một số phƣơng pháp gán nhãn từ loại không có hƣớng dẫn, trên cơ sở đó đƣa ra một quy trình giải quyết bài toán gán nhãn từ loại tiếng Việt bằng cách tiếp cận này. Cấu trúc luận văn Cấu trúc luận văn chia làm 3 chƣơng: Chƣơng I: Tổng quan Trong chƣơng này sẽ trình bày tổng quan về bài toán gán nhãn từ loại, các tiếp cận để giải quyết bài toán gán nhãn từ loại, so sánh các tiếp cận. Chƣơng này cũng trình bày hiện trạng cùng các phƣơng pháp đã đƣợc dùng để giải quyết bài toán gán nhãn từ loại cho tiếng Việt, khó khăn chƣa khắc phục đƣợc. Chƣơng II: Cơ sở toán học Chƣơng này sẽ trình bày các kiến thức toán học, các mô hình học máy đƣợc sử dụng trong luận văn. Chƣơng III: Cách tiếp cận không có hƣớng dẫn cho bài toán gán nhãn từ loại Chƣơng này sẽ trình bày một số phƣơng pháp học máy không có hƣớng dẫn cho bài toán gán nhãn từ loại, để từ đó có thể xây dựng một quy trình giải quyết bài toán gán nhãn từ loại tiếng Việt theo cách tiếp cận này. 7 Chƣơng 1 - TỔNG QUAN 1.1 Bài toán gán nhãn từ loại Gán nhãn từ loại là việc xác định các chức năng ngữ pháp của từ trong câu hay là quá trình gán từng từ trong đoạn văn bản với các đánh dấu từ loại hoặc cấu trúc ngữ pháp. Đây là bƣớc cơ bản trƣớc khi phân tích cú pháp hay các vấn đề xử lý ngôn ngữ phức tạp khác. Thông thƣờng, một từ có thể có nhiều chức năng ngữ pháp, ví dụ: trong câu “con ngựa đá đá con ngựa đá”, cùng một từ “đá” nhƣng từ thứ nhất và thứ ba giữ chức năng ngữ pháp là danh từ, nhƣng từ thứ hai lại là động từ trong câu. Gán nhãn từ loại là mức thấp nhất của phân tích ngữ nghĩa. Xác định từ loại hỗ trợ cho việc phân tích cú pháp các văn bản, góp phần giải quyết tính đa nghĩa của từ, và trợ giúp các hệ thống rút trích thông tin hƣớng đến ngữ nghĩa, v.v. Ví dụ1: John/ NNP saw/ VBD the/ DT saw/NN and/CC decided/VBD to/TO take/VB it/PRP to/IN the/DT table/N. Ví dụ 2: Loan/Np muốn/V đi/V du lịch/V Huế/Np. Trong đó các nhãn NNP, Np, NN, N: danh từ. VBD, V: động từ. DT: từ hạn đinh. IN, TO: giới từ. 1.2 Tổng quan về cách tiếp cận giải bài toán 1.2.1 Quá trình gán nhãn từ loại Gán nhãn từ loại là một quá trình gồm 3 bƣớc xử lý:[2] - Bƣớc 1 (tiền xử lí): Phân tách xâu kí tự thành chuỗi các từ. Giai đoạn này có thể phức tạp hay đơn giản tuỳ theo ngôn ngữ và từng 8 đơn vị từ vựng. Chẳng hạn với tiếng Anh và tiếng Pháp, việc phân tách từ chủ yếu dựa vào ký tự trắng. Tuy nhiên vẫn có những cụm từ ghép hay những cụm từ công cụ gây tranh cãi về cách xử lý. Trong khi đó với tiếng Việt thì dấu trắng không phải là dấu hiệu để xác định ranh giới các đơn vị từ vựng do tần số xuất hiện từ ghép là rất cao. - Bƣớc 2: Gán nhãn tiên nghiệm, tức là tìm cho mỗi từ tập tất cả các nhãn từ loại mà nó có thể có. Tập nhãn này có thể thu đƣợc từ cơ sở dữ liệu từ điển hoặc từ kho văn bản đã gán nhãn bằng tay. Đối với một từ mới chƣa xuất hiện trong cơ sở dữ liệu thì có thể sử dụng một nhãn ngầm định hoặc gắn cho nó tập tất cả các nhãn. Trong các ngôn ngữ biến đổi hình thái ngƣời ta cũng dựa vào hình thái từ để đoán nhận lớp từ loại của từ đang xét. - Bƣớc 3: Quyết định kết quả gán nhãn. Giai đoạn loại bỏ nhập nhằng, tức là lựa chọn cho mỗi từ một nhãn phù hợp nhất với ngữ cảnh trong tập nhãn tiên nghiệm. 1.2.2 Ngữ liệu Để thực hiện gán nhãn từ loại ta phải có kho ngữ liệu[2], chúng có thể là: - Từ điển và các văn phạm loại bỏ nhập nhằng. - Kho văn bản đã gán nhãn, có thể kèm theo các quy tắc ngữ pháp xây dựng bằng tay. - Kho văn bản chƣa gán nhãn, có kèm theo các thông tin ngôn ngữ nhƣ là tập từ loại và các thông tin mô tả quan hệ giữa từ loại và hậu tố. - Kho văn bản chƣa gán nhãn, với tập từ loại cũng đƣợc xây dựng tự động nhờ các tính toán thống kê. Trong trƣờng hợp này khó có thể dự đoán trƣớc về tập từ loại. 9 1.2.3 Các tiếp cận giải bài toán Chúng ta có hai tiếp cận chính cho gán nhãn từ loại tự động:[19] - Tiếp cận có hƣớng dẫn. - Tiếp cận không hƣớng dẫn. Bộ gán nhãn có hƣớng dẫn có đặc thù là dựa trên kho ngữ liệu đã đƣợc gán nhãn cho việc tạo ra các công cụ đƣợc sử dụng cho quá trình gán nhãn. Ví dụ nhƣ là Từ điển bộ gán nhãn, các tần suất từ/nhãn, các xác suất chuỗi nhãn, tập các luật. Các mô hình không hƣớng dẫn không yêu cầu kho ngữ liệu đã gán nhãn nhƣng lại sử dụng các thuật toán tính toán phức tạp để tự động xây dựng các nhóm từ (nghĩa là xây dựng các tập nhãn) và dựa trên các nhóm từ này để tính toán các thông tin xác suất cần thiết cho các bộ gán nhãn thống kê hoặc để xây dựng các luật ngữ cảnh cần thiết cho các hệ thống dựa trên luật. Sự khác nhau giữa hai tiếp cận thể hiện trong bảng sau: Không hƣớng dẫn Có hƣớng dẫn - Lựa chọn tập văn đã gán nhãn/tập nhãn - Rút ra tập nhãn sử dụng dữ liệu huấn luyện chƣa gán nhãn - Tạo ra các từ điển sử dụng tập văn đã gán nhãn - Xây dựng từ điển sử dụng dữ liệu huấn luyện chƣa gán nhãn - Tính toán các công cụ khử nhập nhằng, có thể bao gồm: + các tần suất từ + Các xác suất chuỗi nhãn. + Các thể hiện luật. - Quy nạp các công cụ khử nhập nhằng, có thể bao gồm: + các tần suất từ + Các xác suất chuỗi nhãn Tuy có nhiều sự khách nhau nhƣng chúng cũng có những điểm giống nhau là: - Gán nhãn dữ liệu sử dụng thông tin từ điển đã xây dựng 10 - Khử nhập nhằng bằng các tiếp cận dựa vào thống kê, dựa trên luật hoặc lai các tiếp cận trên. Vì việc khử khử nhập nhằng sử dụng các tiếp cận dựa trên luật hoặc dựa trên thống kê hoặc lai các tiếp cận vậy tiếp theo ta sẽ tìm hiểu các tiếp cận nêu trên. 1.2.5 Gán nhãn dựa trên luật Bộ gán nhãn dựa trên luật sử dụng các luật đƣợc viết bằng tay để phân biệt sự nhập nhằng nhãn, ràng buộc để loại ra các nhãn không phù hợp. Gán nhãn dựa trên luật sử dụng từ điển để tìm các từ loại có thể cho các từ, sử dụng các luật làm thành một nghĩa, ví dụ nhƣ là : det - X - n = X/adj đặc biệt là hàng trăm ràng buộc có thể đƣợc thiết kế một cách thủ công. Các tiếp cận gán nhãn dựa trên luật sử dụng thông tin ngữ cảnh để gán các nhãn cho các từ chƣa biết hoặc các từ nhập nhằng. Các luật này thƣờng đƣợc biết nhƣ các luật khung ngữ cảnh. Nhƣ một ví dụ, một luật khung ngữ cảnh có thể nói một vài điều: Nếu một từ chƣa biết hoặc nhập nhằng X đứng sau một từ hạn định và đứng đằng trƣớc một danh từ, nhãn của nó sẽ là một tính từ. Trong việc bổ sung cho thông tin ngữ cảnh, nhiều bộ gán nhãn sử dụng thông tin hình thái học để thêm vào quy trình khử nhập nhằng. Ví dụ: Nếu một từ nhập nhằng hoặc chƣa biết kết thúc với đuôi “ing” và đằng trƣớc là một động từ thì nhãn của từ đó sẽ là một động từ. (phụ thuộc vào lý thuyết ngữ pháp) V-W (ing) = W/Verb. Vài hệ thống vƣợt quá việc sử dụng thông tin ngữ cảnh và hình thái bằng việc xây dựng các luật gắn với các nhân tố nhƣ là sự viết bằng chữ hoa (có thể xác định nhƣ một danh từ riêng) và hệ thống dấu chấm câu. Thông tin loại này nhỏ hơn hoặc lớn hơn phụ thuộc vào ngôn ngữ đang đƣợc gán nhãn. 11 Các bộ gán nhãn dựa trên luật hầu hết yêu cầu huấn luyện có hƣớng dẫn, nhƣng gần đây đã có rất nhiều quan tâm đến việc quy nạp tự động của các luật. Một tiếp cận để xây dựng luật tự động là để chạy một văn bản chƣa gán nhãn thông qua một bộ gán nhãn và xem cách nó thực hiện. Tiếp đó một ngƣời sẽ duyệt lại đầu ra của bƣớc 1 này và sửa tất cả các từ bị gán nhãn sai. Văn bản đã đƣợc gán nhãn đúng này sẽ đƣợc đƣa vào bộ gán nhãn để bộ gán nhãn học quy tắc sửa lỗi bằng cách so sánh 2 tập dữ liệu. 1.2.6 Gán nhãn thống kê Bộ gán nhãn thống kê đơn giản nhất giải quyết nhập nhằng các từ chỉ đặt cơ sở vào xác suất mà một từ xuất hiện với một nhãn đặc biệt. Nói cách khác, nhãn đƣợc gặp thƣờng xuyên nhất trong tập huấn luyện là nhãn đƣợc gán cho một thể hiện không rõ ràng của từ đó. Vấn đề với tiếp cận này là trong khi nó có thể mang lại một nhãn hợp lệ cho một từ đƣa ra, lại cũng có thể mang lại chuỗi không hợp lệ các nhãn. Một lựa chọn thay thế cho tiếp cận tần số từ là để tính toán xác suất của một chuỗi đã cho của sự xuất hiện các nhãn. Điều này thỉnh thoảng gọi tắt là tiếp cận N-gram, thể hiện rằng nhãn tốt nhất cho một từ đã cho đƣợc xác định bởi xác suất mà nó xuất hiện với N nhãn trƣớc. Thuật toán phổ biến nhất thi hành tiếp cận N-gram là thuật toán Viterbi. Một thuật toán tìm kiếm mà tránh sự khai triển đa thức của một tìm kiếm theo chiều rộng bằng cách làm gọn cây tìm kiếm ở mỗi cấp độ sử dụng các ƣớc lƣợng khả năng cực đại N tốt nhất (Trong đó N là số nhãn của từ theo sau). Mức độ phức tạp tiếp theo có thể đƣợc xây dựng vào trong một bộ gán nhãn thống kê kết hợp hai tiếp cận trƣớc sử dụng các xác suất chuỗi nhãn và các độ đo tần suất từ. Điều này đƣợc biết đến nhƣ là mô hình Markov ẩn. Các giả thiết cơ bản cho mô hình này nhƣ sau: Mỗi trạng thái nhãn đem lại một từ trong câu. Mỗi từ là 12 - Không tƣơng quan với tất cả các từ khác và nhãn của chúng. - Xác suất chỉ phụ thuộc vào N nhãn đằng trƣớc. Các bộ gán nhãn mô hình Markov ẩn và hiện có thể đƣợc thi hành sử dụng thuật toán Viterbi, và là một trong số các thuật toán hiệu quả nhất. Mô hình Markov ẩn (HMM) không thể đƣợc sử dụng trong một lƣợc đồ gán nhãn tự động. Nó tin tƣởng và o các tính toán thống kê trên chuỗi đầu ra. HMM không đƣợc huấn luyện một cách tự động. Giải pháp cho vấn đề này không có khả năng đƣợc huấn luyện một cách tự động là sử dụng thuật toán Baum-Welch, cũng nhƣ là thuật toán tiến-lùi (Forward –Backward). Thuật toán này sử dụng từ hơn là thông tin nhãn cho sự lặp lại xây dựng một chuỗi để cải tiến xác suất của dữ liệu huấn luyện. Một trong những vấn đề còn lại cuả các tiếp cận là: Các từ chƣa biết nên đƣợc xử lý nhƣ thế nào? 1.2.7 Các từ chƣa biết Tất nhiên là các quy tắc trong các bộ gán nhãn dựa trên luật đƣợc trang bị để giải quyết cho vấn đề này, nhƣng trong các mô hình thống kê là làm thế nào để có thể tính toán xác suất mà một từ đã cho xuất hiện với một nhãn nếu từ đó chƣa biết bộ gán nhãn? Có vài giải pháp tiềm năng cho vấn đề này: Một trong những giải pháp sử dụng thông tin hình thái. Trong trƣờng hợp này, bộ gán nhãn tính toán xác suất mà một hậu tố trên một từ chƣa biết xuất hiện với một nhãn đặc biệt. Nếu một mô hình Markov ẩn đang đƣợc sử dụng, xác suất mà một từ chứa đựng hậu tố mà xuất hiện với một nhãn đặc biệt trong chuỗi đã cho đƣợc tính toán. Một giải pháp khác là gán một tập các nhãn mặc định (các lớp mở đặc đặc biệt: Danh từ, tính từ, trạng từ, động từ ) cho các từ chƣa biết và để giải quyết nhập nhằng sử dụng các xác suất mà các nhãn đó xuất hiện tại cuối n-gram trong câu hỏi. Một xác suất khác là để tính toán xác suất mà mỗi nhãn trong tập nhãn xuất hiện tại cuối n-gram và để lựa chọn đƣờng

Trích đoạn

  • Gán nhãn sử dụng kỹ thuật Cực đại hóa kỳ vọng
  • Gán nhãn sử dụng kỹ thuật Cực đại hóa kỳ vọng
  • Gán nhãn từ loại bằng kỹ thuật phân cụm
  • Đề xuất phương pháp không hướng dẫn cho bài toán gán nhãn từ loại tiếng Việt

Tài liệu liên quan

  • Nghiên cứu và cài đặt bộ gán nhãn từ loại cho song ngữ Anh-Việt Nghiên cứu và cài đặt bộ gán nhãn từ loại cho song ngữ Anh-Việt
    • 113
    • 1
    • 4
  • Nghiên cứu xây dựng phần mềm tự động đọc văn bản chữ Việt bằng phương phát tổ hợp Nghiên cứu xây dựng phần mềm tự động đọc văn bản chữ Việt bằng phương phát tổ hợp
    • 61
    • 2
    • 4
  • NGHIÊN CỨU VÀ CÀI ĐẶT BỘ GÁN NHÃN TỪ LOẠI CHO SONG NGỮ ANH VIỆT NGHIÊN CỨU VÀ CÀI ĐẶT BỘ GÁN NHÃN TỪ LOẠI CHO SONG NGỮ ANH VIỆT
    • 113
    • 684
    • 1
  • Tài liệu VẤN ĐỀ GÁN NHÃN TỪ LOẠI CHO VĂN BẢN TIẾNG VIỆT pdf Tài liệu VẤN ĐỀ GÁN NHÃN TỪ LOẠI CHO VĂN BẢN TIẾNG VIỆT pdf
    • 11
    • 734
    • 1
  • Nghiên cứu gán nhãn từ loại cho văn bản tiếng việt bằng phương pháp học máy không có hướng dẫn Nghiên cứu gán nhãn từ loại cho văn bản tiếng việt bằng phương pháp học máy không có hướng dẫn
    • 13
    • 1
    • 2
  • Nghiên cứu và cái đặt bộ gán nhãn từ loại cho song ngữ Anh -VIệt ppt Nghiên cứu và cái đặt bộ gán nhãn từ loại cho song ngữ Anh -VIệt ppt
    • 113
    • 437
    • 0
  • Luận văn:Nghiên cứu và cài đặt bộ gán nhãn từ loại cho song ngữ Anh-Việt potx Luận văn:Nghiên cứu và cài đặt bộ gán nhãn từ loại cho song ngữ Anh-Việt potx
    • 113
    • 440
    • 0
  • Nghiên cứu kết quả điều trị sỏi niệu quản 13 dưới bằng phương pháp tán sỏi ngoài cơ thể trên máy HK ESWL v tại bệnh viện việt nam  thụy điển uông bí Nghiên cứu kết quả điều trị sỏi niệu quản 13 dưới bằng phương pháp tán sỏi ngoài cơ thể trên máy HK ESWL v tại bệnh viện việt nam thụy điển uông bí
    • 90
    • 1
    • 3
  • Nghiên cứu xây dựng phần mềm tự động đọc văn bản chữ Việt bằng phương phát tổ hợp formant Nghiên cứu xây dựng phần mềm tự động đọc văn bản chữ Việt bằng phương phát tổ hợp formant
    • 94
    • 408
    • 0
  • nghiên cứu gán nhãn từ loại cho văn bản tiếng việt bằng phương pháp học máy không có hướng dẫn nghiên cứu gán nhãn từ loại cho văn bản tiếng việt bằng phương pháp học máy không có hướng dẫn
    • 53
    • 604
    • 2

Tài liệu bạn tìm kiếm đã sẵn sàng tải về

(1.65 MB - 53 trang) - nghiên cứu gán nhãn từ loại cho văn bản tiếng việt bằng phương pháp học máy không có hướng dẫn Tải bản đầy đủ ngay ×

Từ khóa » Gán Nhãn Từ Loại Tiếng Việt