Cách Tìm Và Xoá Trùng Lấp Trong Excel Một Cách Nhanh Chóng

Nếu bạn là người dùng Microsoft Excel, bạn đã từng được yêu cầu làm việc với các dữ liệu lộn xộn trong một bảng tính. Dữ liệu có thể chứa bản ghi trùng lặp. Chắc chắn, bạn không có thời gian để đi từng dòng trong một bảng tính lớn và tự tìm, loại bỏ những bản ghi trùng lặp.

Tin tốt lành là Microsoft đã thấy được nhu cầu này trong Excel. Chức năng Remove Duplicates giúp bạn nhanh chóng tìm và loại bỏ những bản ghi trùng lặp trong bảng tính của bạn.

Example of Removing Duplicates in Microsoft ExcelExample of Removing Duplicates in Microsoft ExcelExample of Removing Duplicates in Microsoft Excel
Trong một vài lần nhấp chuột, tôi gỡ bỏ các bản sao trùng lặp trong bảng tính của mình với chức năng Remove Duplicates của Excel.

Trong hướng dẫn này, tôi sẽ dạy cho bạn sử dụng Remove Duplicates. Bạn sẽ tìm hiểu để sử dụng các chức năng nhằm làm sạch bảng tính với các hàng trùng lặp. Tôi sẽ dạy cho bạn thủ thuật về cách sử dụng các tính năng một cách chính xác để xóa đúng hàng trùng lặp.

Để theo dõi bài hướng dẫn này, tôi khuyên bạn nên tải về một mẫu bảng tính làm ví dụ. Bạn có thể tìm liên kết màu xanh Download Attachment phía bên phải của bài hướng dẫn này hoặc tải miễn phí bài tập bảng tính tại đây.

Bắt đầu với loại bỏ trùng lặp trong Excel

Nếu bạn đang xem một cuốn sách bài tập, sử dụng bảng tính có tiêu đề Order List trong phần hướng dẫn này.

Hãy bắt đầu với một ví dụ đơn giản về cách loại bỏ trùng lặp trong Excel. Trong bảng tính dưới đây, bạn có thể thấy có một vài dòng được nhân đôi. Chúng ta cần phải loại bỏ các đơn đặt hàng trùng lặp để  cho danh sách đơn giản hơn.

Duplicate Order List ExcelDuplicate Order List ExcelDuplicate Order List Excel
Danh sách này có một số bản sao đòi hỏi chúng ta cần phải loại bỏ.

1. Tô sáng dữ liệu của bạn

Để loại bỏ các hàng trùng lặp, đầu tiên bạn nên làm là tô sáng dữ liệu của bạn. Nếu trang tính của bạn không có các dữ liệu trên bảng, bạn có thể đánh dấu toàn bộ cột ở trên cùng của bảng tính. Trong trường hợp này, tôi sẽ làm nổi bật bảng dữ liệu để loại bỏ thành phần trùng lặp.

Highlight Data to Remove Duplicates ExcelHighlight Data to Remove Duplicates ExcelHighlight Data to Remove Duplicates Excel
Tôi đã tô sáng các hàng có chứa dữ liệu của tôi để chuẩn bị loại bỏ trùng lặp.

2. Tìm chức năng Remove Duplicates trên Excel

Tính năng Remove Duplicates hiển thị trên thanh thực đơn của Excel trên tab Data. Cụ thể, bạn sẽ tìm thấy tính năng Remove Duplicates trong phần Data Tools của thanh thực đơn. Một khi bạn tìm thấy nó, chỉ cần nhấp vào nó để khởi động.

Excel Remove Duplicates FeatureExcel Remove Duplicates FeatureExcel Remove Duplicates Feature
Tính năng Remove Duplicates trên tab Data trong thanh công cụ của Excel, trong phần  Data Tools.

3. Chọn tiêu chí trùng lặp của bạn

Sau khi bạn nhấp vào tùy chọn Remove Duplicates, một cửa sổ mới sẽ bật lên với một số hộp kiểm. Danh sách tùy chọn này yêu cầu bạn xác định các trường mà cần phải kiểm tra cho các bản sao. Theo mặc định là đánh dấu kiểm tất cả.

Trong ví dụ đơn giản của chúng tôi, không thực hiện bất kỳ thay đổi nào trên cửa sổ này. Nhấn "OK" để loại bỏ các bản sao từ bảng tính của chúng tôi.

List of Criteria for Duplicates ExcelList of Criteria for Duplicates ExcelList of Criteria for Duplicates Excel
Sau khi nhấp vào Remove Duplicates, Excel sẽ mở một cửa sổ mới với một danh sách các hộp kiểm; không làm thay đổi ví dụ đơn giản của chúng tôi.

4. Xem lại các kết quả

Một khi bạn bấm OK, Excel sẽ loại bỏ các bản sao trong bảng tính và cung cấp thông tin phản hồi về những gì đã được gỡ bỏ. Khi làm việc với bất kỳ dataset, tôi mong bạn xem lại các kết quả.

Mục đích của việc loại bỏ các bản sao là để xóa các hàng trùng lặp, nhưng nó đòi hỏi phải cẩn trọng khi sử dụng. Bạn luôn luôn có thể hoàn tác bước cuối cùng, nếu bạn áp dụng nó không chính xác.

Duplicate Values Found RemovedDuplicate Values Found RemovedDuplicate Values Found Removed
Remove Duplicates cung cấp thông tin phản hồi về số lượng dòng đã được gỡ bỏ và số lượng dòng đã bị ảnh hưởng sang trái.

Loại bỏ nhanh các bản sao - Video hướng dẫn

Xem trên màn hình về cách sử dụng chức năng Remove Duplicates trong Excel. Tiếp tục đọc các hướng dẫn dưới đây với hướng dẫn bằng văn bản, hướng dẫn cụ thể hơn về tính năng Remove Duplicates và một số kỹ thuật bổ sung để tìm và xóa các bản sao.

Remove Duplicates trên nhiều tiêu chí

Hãy quay về trình đơn đơn giản mà pop-up hiện lên khi chúng ta tô sáng dữ liệu. Danh sách trên cửa sổ này hiển thị cho mỗi cột trong bảng tính Excel. Bạn sẽ nhận thấy rằng mỗi cột trong bảng của Excel có một hộp kiểm bên cạnh nó.

Thực đơn này có ý nghĩa như thế nào? Về cơ bản, hộp này hỏi bạn cụ thể là Excel làm gì khi xóa các bản trùng lặp. Hãy nhìn vào ví dụ:

Remove Duplicates on 1 FactorRemove Duplicates on 1 FactorRemove Duplicates on 1 Factor
Ví dụ về Remove Duplicates.

Trong ảnh chụp màn hình ở trên, tôi bắt đầu bằng cách tô sáng dữ liệu một lần nữa và sử dụng tính năng Remove Duplicates. Sau đó, tôi hủy đánh dấu tất cả các hộp kiểm ngoại trừ "Chef" trong cửa sổ Remove Duplicates. Kết quả được hiển thị ở phía dưới một nửa của ảnh. Nhận thấy rằng bảng của chúng tôi đã được giảm xuống chỉ ba dòng, với mỗi tên chef xuất hiện một lần.

Khi chúng tôi chỉ đặt dấu kiểm vào hộp kiểm "Chef", chúng tôi yêu cầu Excel chỉ kiểm tra cột Chef đối với bất kỳ bản sao nào. Lần đầu, Excel thấy tên Chef lặp lại, nó xóa toàn bộ dòng; nó không quan trọng những cột khác nhau.

Hãy cẩn thận với tính năng Remove Duplicates trên Excel

Đây là lý do tại sao nó quan trọng cần phải cẩn thận khi sử dụng tính năng "Remove Duplicates". Nếu bạn chỉ cần để thiết lập để loại bỏ một yếu tố duy nhất, bạn có thể vô tình xóa dữ liệu mà bạn muốn giữ lại.

Mẹo: Các hộp bạn gỡ bỏ kiểm tra trong cửa sổ Remove Duplicates là sự kết hợp kiểm tra các bản sao của Excel. Để lại nhiều hộp kiểm tra để loại bỏ các trùng lặp chính xác.

Thông thường, cột dữ liệu đơn sẽ không đủ để chia thành các bản sao. Nếu bạn duy trì một cửa hàng trực tuyến và có cơ sở dữ liệu của khách hàng, cơ hội bạn sẽ có nhiều hơn một khách hàng như "Mike Smith" làm ví dụ trong dữ liệu của bạn. Bạn cần kiểm tra nhiều cột - chẳng hạn như tên khách hàng, địa chỉ khách hàng hoặc ngày đăng ký để kiểm tra các bản trùng lặp. Điều này là chính xác vì chúng tôi kiểm tra nhiều cột khi loại bỏ trùng lặp.

Nếu bạn muốn một cách chính xác để loại bỏ trùng lặp, nên để lại nhiều hộp (cột) kiểm tra khi chạy tính năng Remove Duplicates. Và tất nhiên, luôn luôn kiểm tra dữ liệu của bạn sau khi chạy Remove Duplicates.

Khi nào được chọn lọc

Nếu bạn đang xem một sách bài tập mẫu, sử dụng bảng tính tab có tiêu đề Duplicate Shifts để thay đổi phần hướng dẫn này.

Bạn có thể tự hỏi: là có tình huống nào mà bạn sẽ bỏ chọn một số hộp kiểm? Chắc chắn là như vậy. Hãy nhìn vào ví dụ.

Trong bảng tính bên dưới, tôi đã thay đổi dữ liệu nhân viên, và tôi đã vô tình tải về báo cáo vào hai thời điểm khác nhau. Tôi có mỗi cột nhân viên vào làm và nhân viên hết ca, thêm cột ngày tháng mà tôi đã tải trong báo cáo. Trong mỗi hai dòng, với duy nhất một nội dung trong cột F, báo cáo ngày tải về.

Duplicates with fewer criteriaDuplicates with fewer criteriaDuplicates with fewer criteria
Tôi cần phải loại bỏ các bản sao vì báo cáo đã được tải xuống hai lần (xem các cột cuối) nhưng cần phải loại trừ các cột cuối cùng từ việc kiểm tra bản sao.

Hãy suy nghĩ về điều này: nếu tôi kiểm tra tất cả các cột có bản sao, Excel sẽ không tìm thấy bất kỳ bản sao nào. Tuy nhiên, tôi thực sự muốn loại bỏ dữ liệu nhân viên thay đổi bị trùng lặp. Tôi thực sự không quan tâm về ngày tôi tải về các báo cáo, vì vậy tôi cần phải loại trừ cột F khi thực hiện loại bỏ trùng lặp.

No Duplicates Found ErrorNo Duplicates Found ErrorNo Duplicates Found Error
Hầu như những dòng là chính xác giống nhau; chỉ duy nhất có cột F là khác nhau và tôi không muốn Excel kiểm tra  nó như là một phần của việc loại bỏ các bản sao. Nếu bạn đánh dấu kiểm trong tất cả các hộp, Excel sẽ không tìm thấy bất kỳ giá trị trùng lặp nào.

Những dòng này không phải là bản sao chính xác - Chúng không chia sẻ trong tất cả các trường - nhưng tôi cần phải loại bỏ trùng lặp dựa trên cột A-E.

Để thực hiện điều này, tôi sẽ tô sáng bảng một lần nữa và mở tính năng  Remove Duplicates lần nữa. Lần này, tôi sẽ đánh dấu kiểm vào tất cả các hộp ngoại trừ Report Download Date.

Removed duplicates in Excel while ignoring a columnRemoved duplicates in Excel while ignoring a columnRemoved duplicates in Excel while ignoring a column
Chú ý rằng Excel đã loại bỏ các bản sao vì nó bỏ qua kiểm tra cột F là một phần của tiến trình.

Hãy suy nghĩ về điều này: những hộp kiểm mà bạn đánh dấu kiểm là cột mà Excel bao gồm các bước kiểm tra bản sao. Nếu có bổ sung thêm cột mà không được đánh dấu kiểm cho các bản sao thì hủy dấu kiểm từ cửa sổ Report Download Date.

Sử dụng Remove Duplicates để loại bỏ dòng trống

Một trong sở thích của tôi là sử dụng tính năng Remove Duplicates để loại bỏ nhiều dòng trống trong dữ liệu của tôi.

Remove Blank Rows ExcelRemove Blank Rows ExcelRemove Blank Rows Excel
Remove Duplicates cũng là một chức năng tuyệt vời để loại bỏ dòng trắng trong một bảng tính lộn xộn.

Để loại bỏ các dòng trống, tô sáng dữ liệu trong bảng tính của bạn. Sau đó, sử dụng chức năng Remove Duplicates và để lại dấu kiểm vào tất cả các hộp kiểm. Excel sẽ loại bỏ tất cả các dòng trống - ngoại trừ dòng đầu tiên! Kể từ khi dòng trống đầu tiên về mặt kỹ thuật không phải là một bản sao, Excel loại bỏ nó không bị ảnh hưởng. Bạn chỉ cần xoá thủ công hàng đó.

Ghi nhớ rằng chức năng này sẽ loại bỏ tất cả các dòng lặp lại, không chỉ là các hàng trống trùng lặp.

Tóm lược lại

Loại bỏ các bản sao từ một bảng tính trên Excel là kỹ năng dọn dẹp dữ liệu. Khi bạn đang làm việc với một dataset, bạn hầu như không có thời gian để tự tìm và loại bỏ bản ghi trùng lặp. Đó là lý do vì sao Excel xây dựng chức năng "Remove Duplicates" đáng để tìm hiểu.

Dưới đây là hai bảng tính hướng dẫn khác để tiếp tục hướng dẫn xóa dữ liệu trong Excel:

  • Tài liệu chính thức của Microsoft trên Remove Duplicates là một nguồn hữu ích, nguồn thứ hai cho việc học tập các tính năng.
  • Hướng dẫn của Bob Flisser 12 Techniques for Power Users chứa một bản tóm tắt ngắn gọn chức năng Remove Duplicates, và các kỹ thuật quan trọng khác cho quản lý dữ liệu.

Bạn sử dụng tính năng Remove Duplicates để quản lý các bảng tính Excel của bạn như thế nào? Nếu bạn có bất kỳ vấn đề gì, hãy để lại một bình luận để được giúp đỡ.

Từ khóa » Cách Kiểm Tra Dữ Liệu Trùng Trong Excel 2016