Cách xử lý dữ liệu trùng lặp trong Excel

Trong quá trình làm việc với , việc gặp phải dữ liệu bị trùng lặp là không tránh khỏi, đặc biệt khi bạn phải xử lý với một lượng dữ liệu lớn. Dữ liệu trùng nhau không chỉ gây ra nhầm lẫn mà còn ảnh hưởng đến tính chính xác của các phân tích dữ liệu. Nhưng đừng lo, Excel cung cấp nhiều công cụ mạnh mẽ giúp bạn dễ dàng lọc và xử lý .

Trong bài này, mình sẽ có một bảng như sau:

STT Tên Năm Sinh Nơi Ở
1 Anh 2003 Hà Nội
2 Bình 1999 TP HCM
3 Chi 1993 Đà Nẵng
4 Dương 1982 Hải Phòng
5 Em 2005 Cần Thơ
6 Giang 1983 Nha Trang
7 Hiếu 2002 Hue
8 Linh 1996 Vinh
9 Minh 1981 Quảng Ninh
10 Nam 1985 Bình Dương
11 Oanh 1989 Đăk Lăk
12 Phương 1986 Cà Mau
13 Quý 2000 Kiên Giang
14 Thành 1987 Lâm Đồng
15 Uyên 1992 Thanh Hóa
16 Vân 2001 Nghệ An
17 Xuân 1980 Hà Tĩnh
18 Yến 1998 Quảng Bình
19 Lan 1984 Quảng Trị
20 Hoa 1992 Bắc Kạn

Nhập vào Excel

Lọc dữ liệu trùng lặp trong ExcelSử dụng tính năng Remove Duplicates

Bước 1: Chọn dữ liệu

  • Chọn tab Dữ liệu trên thanh công cụ.
  • Bấm vào nút ba chấm > Sau đó click vào Loại bỏ nội dung trùng lặp.

Lọc dữ liệu trùng lặp trong ExcelBước 2: Thiết lập

  • Nếu dữ liệu của bạn có dòng tiêu đề, đảm bảo đã tick vào Dữ liệu của tôi có đầu trang.
  • Chọn Chọn tất cả cột để áp dụng cho toàn bộ dữ liệu hoặc chỉ chọn một số cột cụ thể. Ở đây mình cần lọc cột Nơi Ở nên chỉ chọn cột tương ứng.

Cách xử lý dữ liệu trùng lặp trong ExcelBước 3: Xóa dữ liệu trùng

  • Nhấn “OK” để xóa dữ liệu trùng. Excel sẽ thông báo số dữ liệu trùng đã xóa và số dữ liệu duy nhất còn lại.

Cách xử lý dữ liệu trùng lặp trong ExcelSử dụng tính năng Conditional Formatting

  • Vào tab Trang đầu, bấm vào nút ba chấm, chọn Định dạng có điều kiện > Quy tắc tô sáng sau đó chọn Giá trị trùng lặp.
    Cách xử lý dữ liệu trùng lặp trong Excel
  • Chọn phạm vi áp dụng để làm nổi bật dữ liệu trùng lặp, Kiểu quy tắc, màu định dạng sau đó chọn Hoàn tất.
    Cách xử lý dữ liệu trùng lặp trong Excel
  • Màu sắc sẽ làm nổi bật dữ liệu trùng lặp hoặc duy nhất
    Cách xử lý dữ liệu trùng lặp trong Excel

Lọc dữ liệu trùng bằng Advanced Filter

  • Mở thẻ “Data”, sau đó chọn “Sort & Filter” và click vào “Advanced”.
  • Chọn “Filter the list, in-place” hoặc “Copy to another location” tùy vào mục đích sử dụng.
  • Tick vào “Unique records only” để chỉ lọc ra dữ liệu duy nhất.

Lưu ý: Tính năng này mình không thấy trong bản Office 365.

Lọc dữ liệu trùng bằng

  • Chọn dữ liệu, vào thẻ Chèn và chọn PivotTable. Cấu hình như bảng Tạo PivotTable bên dưới rồi OK để tạo một bảng mới.
    Cách xử lý dữ liệu trùng lặp trong Excel
  • Kéo cột muốn lọc vào ô Hàng và Giá trị. Bạn sẽ thấy các giá trị lớn hơn 1 là các ô trùng.
    Cách xử lý dữ liệu trùng lặp trong Excel

Sử dụng công thức để lọc dữ liệu trùng

  • Giả sử bạn muốn lọc dữ liệu trùng giữa hai bảng, sử dụng công thức =IF(ISNA(VLOOKUP(A2,Sheet1!A:C,1,0)),"Unique","Duplicate") để kiểm tra.

Bằng cách áp dụng 5 phương pháp trên, bạn có thể dễ dàng lọc và quản lý dữ liệu trùng lặp trong Excel, từ đó nâng cao hiệu quả công việc và độ chính xác của các phân tích dữ liệu. Đừng quên kiểm tra và sử dụng tính năng phù hợp với nhu cầu cụ thể của bạn để đạt được kết quả tốt nhất.

Nội dung trên đã cung cấp một hướng dẫn chi tiết về cách lọc dữ liệu trùng nhau trong Excel, giúp bạn xử lý dữ liệu một cách nhanh chóng và hiệu quả. Hãy thực hành để thành thạo các thủ thuật này, chúc bạn thành công!

Hãy tạo ra một cộng đồng lành mạnh và chia sẻ kiến thức với nhau nhé.

Thông Báo Mới