Восстановление страниц из Content.IE5 (Есть ли программы для вылова кэшированных файлов в кэше IE5...11?)

ATauenis · Сообщение **ATauenis** » 28.02.2018,17:17

Есть ли программы для вылова кэшированных файлов в кэше IE5...11?

Не в первый раз нахожу на старых жёстких дисках огромные кэши IE со страницами, которых нет в Web Archive. В основном это результаты поисковиков середины нулевых и подобный полу хлам. Если включить автономный режим, можно "полазить" в поиске Яндекса образца 2008 года, или посмотреть прогноз погоды, который выбирается через JavaScript. Очень хорошо IE переадресует все запросы к интернету в свой кэш. Порылся в кэше, там все файлы в неизменном виде, и есть БД в формате, который как бы описан, но по факту набор полей там произвольный, и упомянутому описанию соответствует только часть файла. Поэтому начал писать утилиту, которая сканирует весь кэш на предмет ht* файлов, а далее ищет картинки и прочие ресурсы по именам файлов. Но это весьма весёлая задача, особенно когда есть ссылка на какой-нибудь index.htm, и поди угадай, какой из 100 index.htm[ * ] там упомянут. Разобрать формат index.dat пока не вышло, но, может быть, ещё разберусь.

Вопрос: есть ли какие-нибудь готовые утилиты, преобразующие кэш IE в читабельный формат (типа как у Teleport Pro)? Или я первопроходец за без года 20 лет существования этого формата?

pahan · Сообщение **pahan** » 28.02.2018,18:03

Не очень понял задачу, но вот здесь вроде есть параметр, позволяюший распихать файлы по папкам, как на исходном сайте.

ATauenis · Сообщение **ATauenis** » 28.02.2018,20:38

pahan, задачу поняли верно, надо реанимировать кэш, чтобы страницы из него открывались не только в автономном режиме на компе, содержащем кэш, но и на других. IECacheView на справляется на 4-, ссылки (и картинки, стили, js) на другие домены остаются как есть. Но простые (однодоменные) сайты восстановил отлично. В целом, можно заменить http/https в файлах на адрес корневой папки с достанными страницами, и будет то, что надо. Скорее всего.

Ещё обнаружил недостаток. Ест только папку Temporary Internet Files, отдельно Content.IE5 не признаёт. Также не завелась на WinME.

Igor Michailov · Сообщение **Igor Michailov** » 01.03.2018,10:13

Если задача посмотреть температуру в прошлые года, то можно на гисметео в разделе Дневник это сделать.

Например, 1 марта 2000 года в Москве была температура +5С

В целом же задача автоматического восстановления веб-страниц из кешей браузеров решается плохо. Как правило, после автоматического восстановления, страницы нуждаются в ручной обработке рашпилем (как в известном бородатом анекдоте).

ATauenis · Сообщение **ATauenis** » 01.03.2018,10:49

Не, дело не только в температуре. Интересно поностальгировать по старому виду выдачи Яндекса, страницам ВКонтакте вида задолго до моей регистрации там, блоку поиска в боковой панели IE, личным кабинетам модемных провайдеров и т.д.. Также в кэше вижу остатки update.microsoft.com для WinME, может, что-нибудь там будет полезное. Потом, когда отсортирую что можно выкладывать, а что нет, выложу у себя на сайте (в Web.Archive.Org всего этого нет и быть не может, многое требовало логины-пароли или скрыто в robots.txt).

Igor Michailov писал(а):В целом же задача автоматического восстановления веб-страниц из кешей браузеров решается плохо.

Однако, IE с этим отлично справляется, если включить автономный режим.

Руками его работа проделывается так:
1.) Поменять "[font=Courier]http://[/font]", "[font=Courier]"http://[/font]" и "[font=Courier]"//[/font]" на путь к папке восстановленных страниц.
2.) Распаковать что сжато Gzip'ом (самый сложный для автоматизации процесс, пока думаю, как его проделать грамотно).
3.) Подправить пути.
4.) Можно запускать машину времени

Полигон призраков

Восстановление страниц из Content.IE5 (Есть ли программы для вылова кэшированных файлов в кэше IE5...11?)

Вклад в сообщество

Восстановление страниц из Content.IE5

Вклад в сообщество

Вклад в сообщество

Вклад в сообщество