Страница 1 из 1
Поиск по нечеткому совпадению
Добавлено: 03 фев 2015, 12:33
Сергей_01
Уважаемые коллеги. Не силен в языках, как говорится... Помогите написать код для ёкселя.
Задача. Дано:
1. На одном листе текстовые ячейки (в конкретном случае с адресами домов или др.);
2. На втором листе текстовые ячейки с теми же адресами, в которых перепутана последовательность представления адреса и добавлен всякий мусор, не относящийся к нему. Однако короткие (в 2-3 символа) последовательности все же имеются (например: д.19 и д_19; ул. Красная и Красная улица; и т.п.). При этом общая длина текста (+ пробелы и т.п.) может составлять до 100 символов.
3. На втором же листе находятся числовые ячейки, в которых указаны характеристики, соответствующие хламообразным текстовым ячейкам (адресам).
Необходимо найти:
1. Нечетко совпадающие (примерно на 70% или на худой конец 60%) ячейки первого и второго листа.
2. На первый лист перенести данные второго листа, в соответствии с выявленным нечетким совпадением.
Как быть??? С уважением С.
Re: Поиск по нечеткому совпадению
Добавлено: 09 фев 2015, 03:10
Сергей_01
Ну что же? Как говорится, прошли годы... Не форум, а пещера какая-то,

Целую неделю все заглядывают, а предложить то и ничего. Да, задачка, прямо скажем, муторная.
Но я нашел интересные варианты на planetaexcel:
http://www.planetaexcel.ru/forum/index. ... ITLE_SEO=9.
Мне помогло, но правда, не очень. В сложной базе (именно моей) общий объем совпадений (с достоверностью более 70%) - не более 40%.
С уважением.
Сергей.
Re: Поиск по нечеткому совпадению
Добавлено: 09 фев 2015, 03:11
Сергей_01
Ну что же? Как говорится, прошли годы... Не форум, а пещера какая-то,

Целую неделю все заглядывают, а предложить то и ничего. Да, задачка, прямо скажем, муторная.
Но я нашел интересные варианты на planetaexcel:
http://www.planetaexcel.ru/forum/index. ... ITLE_SEO=9.
Мне помогло, правда, но не очень. В сложной базе (именно моей) общий объем совпадений (с достоверностью более 70%) - не более 40%.
Re: Поиск по нечеткому совпадению
Добавлено: 09 фев 2015, 03:16
Сергей_01
Ну что же? Как говорится, прошли годы... Не форум, а пещера какая-то,

Целую неделю все заглядывают, а предложить то и ничего. Да, задачка, прямо скажем, муторная.
Но я нашел интересные варианты на planetaexcel:
http://www.planetaexcel.ru/forum/index. ... ITLE_SEO=9.
Мне помогло, но правда, не очень. В сложной базе (именно моей) общий объем совпадений (с достоверностью более 70%) - не более 40%.
Re: Поиск по нечеткому совпадению
Добавлено: 09 фев 2015, 03:24
Сергей_01
Сергей_01 писал(а):Уважаемые коллеги. Не силен в языках, как говорится... Помогите написать код для ёкселя.
Задача. Дано:
1. На одном листе текстовые ячейки (в конкретном случае с адресами домов или др.);
2. На втором листе текстовые ячейки с теми же адресами, в которых перепутана последовательность представления адреса и добавлен всякий мусор, не относящийся к нему. Однако короткие (в 2-3 символа) последовательности все же имеются (например: д.19 и д_19; ул. Красная и Красная улица; и т.п.). При этом общая длина текста (+ пробелы и т.п.) может составлять до 100 символов.
3. На втором же листе находятся числовые ячейки, в которых указаны характеристики, соответствующие хламообразным текстовым ячейкам (адресам).
Необходимо найти:
1. Нечетко совпадающие (примерно на 70% или на худой конец 60%) ячейки первого и второго листа.
2. На первый лист перенести данные второго листа, в соответствии с выявленным нечетким совпадением.
Как быть??? С уважением С.
Ну что же? Как говорится, прошли годы... Не форум, а пещера какая-то,

Целую неделю все заглядывают, а предложить то и ничего. Да, задачка, прямо скажем, муторная.
Но я нашел интересные варианты на planetaexcel:
http://www.planetaexcel.ru/forum/index. ... ITLE_SEO=9.
Мне помогло, но правда, не очень. В сложной базе (именно моей) общий объем совпадений (с достоверностью более 70%) - не более 40%.
Конечно - совершенствованию нет пределов. А пока что - вот так.
С уважением С.
Re: Поиск по нечеткому совпадению
Добавлено: 09 фев 2015, 03:30
Сергей_01
Ну и что же? Как говорится, прошли годы... Не форум, а пещера какая-то,

Целую неделю все заглядывают, а предложить то и ничего. Да, задачка, прямо скажем, муторная.
Но я нашел интересные варианты на planetaexcel:
http://www.planetaexcel.ru/forum/index. ... ITLE_SEO=9.
Мне помогло, но правда, не очень. В сложной базе (именно моей) общий объем совпадений (с достоверностью более 70%) - не более 40%.
Конечно - совершенствованию нет пределов. А пока что - вот так.
С уважением С.