Как да премахнете дублирани данни в Excel

Електронните таблици на MS Excel се използват за анализ на съдържащите се в тях данни. Информацията се анализира в първоначалната си форма, но по-често изисква предварителна редакция. В статията ще разгледаме как да се отървем от ненужните, повтарящи се данни, ако те усложнят обработката на файла.

Намиране на дублиращи се стойности

Помислете за пример. Магазинът за козметика редовно получава ценови листи от компаниите доставчици във формат Excel. Да предположим за удобство, че имената на стоките във всички фирми са еднакви. За да направим поръчка, искаме първо да определим кои от фирмите кои продукти са по-изгодни за поръчка. За да направите това, трябва да намерите същите записи и да сравните цените в тях. Докато не премахнем дублиранията в Excel, ще намерим само същите стоки за анализ на разходите. За да направим това, ще използваме форматирането на клетки като условие. Разпределете колоната с името на стоката и отворете лентата с инструменти "Стилове" в раздела "Начало". Бутонът "Условно форматиране" отваря списъка на падащите команди, от които се интересуваме от "Правила за избор на клетки".


Нуждаем се от правилото - "Повторяеми стойности". В прозореца посочете цвета, който ще бъде маркиран с дублиращи се елементи от обхвата. След сдвояването на клетките с помощта на филтър можете да изберете само тях, да ги подредите по име на продуктите, да извършите анализ на цените и да премахнете дублирания в Excel.

Търсене на уникални стойности

Методът, описан по-горе, също е подходящ за избиране на елементи, които се намират в единствено число. За такъв избор направете същото като в предишния параграф. Отворете раздела Стилове в раздела Начало и натиснете бутона "Условно форматиране". В списъка с операции изберете "Правила за избор на клетки".


Но сега в прозореца за настройки на филтъра трябва да изберете от падащия списък стойността да не е Повтарям, и „Уникално“. Програмата ще маркира избрания цвят само за елементите в колоната, които се появяват в един екземпляр.

Премахване на дубликати

След обединяването на няколко ценови листи в един файл в таблицата, има много повтарящи се записи, които трябва да бъдат изтрити. Тъй като продуктовата листа е много дълга, обработката й на ръка отнема много време и изисква значителни усилия. Много по-удобно е да използвате опцията, предлагана от програмата. За да премахнете дублирания в Excel, има съответната команда от менюто. Намира се в раздела "Данни" в блока от операции "Работа с данни". Когато кликнете върху бутон, се отваря диалогов прозорец. Ако групи от клетки не са били разпределени, преди да извикат командата на листа, програмата незабавно предлага да маркира колоните, които трябва да бъдат намерени, и да премахне повторението. Ако предварително изберете полетата на една колона, Excel ще изведе съобщение за уточняване, в което ще е необходимо да изберете дали да използвате само избрания обхват или да го разширите в следващата операция.
След това маркирайте колоните, за да намерите дубликати. Функцията е удобна в това, което позволяванамерете както пълни съвпадения, така и премахнете дублиращи се низове на Excel и ги сравнете само за отделни полета.
Например, в нашия случай можем да търсим повторение само по име, код, тип и производител на стоки, знаейки, че цените и доставчиците ще бъдат различни. Такава обработка ще позволи списъкът на уникалните елементи на продукта да бъде добавен към списъка за собствена ценова листа или каталог.

Избор на уникални записи

Друг начин за премахване на дублирания в Excel е да се избират само уникалните стойности на избрания обхват на таблицата. Нека го покажем на пример. Разпределете група от клетки, които трябва да премахнат дублиращите се стойности, и отворете раздела „Данни“ в раздела „Данни“. Тук намираме блока от команди "Сортиране и филтриране" и избираме един от тях - "Разширено". В прозореца се въвеждат параметрите на полето. Ако не е необходимо да запазвате първоначалната таблица, изберете опцията "Филтриране на списъка на място". Но ако работата с нея не е завършена, по-добре е резултатите от филтъра да се прехвърлят на друго място.
Ние избираме група от полета за обработка и маркираме клетката, в която ще бъдат поставени филтрираните данни. За да получите само уникални записи като резултат, поставете отметка в квадратчето "Само уникални записи". Получаваме резултата от оригиналните 27 записа, само 19 без повторения. По този начин можете да премахнете дублирания в Excel 2003, докато предишната се появи само в версията на програмата 2007.

Допълнителни препоръки

Забележете някои съвети, преди да изтриете информация от таблиците. На първо място, за извършване на такива действияНаправете копие на таблицата и извършвайте операции с нея. Или я оставете като резервно копие и направете промени в оригинала. В противен случай може да загубите данните си на файл или да промените оформлението на листа. Ако изходната таблица съдържа групи, сумиране или междинни суми, трябва да ги премахнете, преди да премахнете дубликатите в колоната на Excel. Намирането на едни и същи елементи не работи в отчетите на обобщените таблици. В допълнение към горното, е възможно да се премахнат дублиращите елементи на колони с помощта на формули, но този метод е доста трудоемък и няма смисъл да се използва в съвременните версии на програмата.

Свързани публикации