Задача: Составить программу, позволяющую сжимать текстовую информацию, а затем преобразовывать сжатую информацию в исходное состояние.
В программе необходимо предусмотреть два варианта. Для хранения текста в сжатом виде найти часто повторяющиеся последовательности из двух букв и заменить их кодом. В качестве кода использовать символы, не встречающиеся в тексте. Составить таблицу кодов. В заданном тексте найти слова, которые встречаются более трех раз, закодировать их и сжать текст, заменив слова кодами. Составить таблицу кодов.
Если не сложно, подскажите, в каком направлении копать информацию, чтобы разобраться с тем как "найти часто повторяющиеся последовательности из двух букв и заменить их кодом" и "В заданном тексте найти слова, которые встречаются более трех раз, закодировать их и сжать текст, заменив слова кодами".
Правильно ли я понимаю, что мне нужно добиться создания массива, в котором будут упорядочены по убыванию все слова, встречающиеся в тексте и каким-то образом отсеять слова, которые встречаются меньше 3-х раз?
Заранее спасибо всем неравнодушным
