Восстановление страниц из Content.IE5 (Есть ли программы для вылова кэшированных файлов в кэше IE5...11?)

Все, что не подходит под определение "старого софта и железа", обсуждается здесь
Ответить
Аватара пользователя
ATauenis
Advanced Member
Сообщения: 5532
Зарегистрирован: 30.04.2015,21:30
Откуда: Москва
Контактная информация:

Вклад в сообщество

Восстановление страниц из Content.IE5

Сообщение ATauenis » 28.02.2018,17:17

Есть ли программы для вылова кэшированных файлов в кэше IE5...11?

Не в первый раз нахожу на старых жёстких дисках огромные кэши IE со страницами, которых нет в Web Archive. В основном это результаты поисковиков середины нулевых и подобный полу хлам. Если включить автономный режим, можно "полазить" в поиске Яндекса образца 2008 года, или посмотреть прогноз погоды, который выбирается через JavaScript. Очень хорошо IE переадресует все запросы к интернету в свой кэш. Порылся в кэше, там все файлы в неизменном виде, и есть БД в формате, который как бы описан, но по факту набор полей там произвольный, и упомянутому описанию соответствует только часть файла. Поэтому начал писать утилиту, которая сканирует весь кэш на предмет ht* файлов, а далее ищет картинки и прочие ресурсы по именам файлов. Но это весьма весёлая задача, особенно когда есть ссылка на какой-нибудь index.htm, и поди угадай, какой из 100 index.htm[ * ] там упомянут. Разобрать формат index.dat пока не вышло, но, может быть, ещё разберусь.

Вопрос: есть ли какие-нибудь готовые утилиты, преобразующие кэш IE в читабельный формат (типа как у Teleport Pro)? Или я первопроходец за без года 20 лет существования этого формата?

pahan
Advanced Member
Сообщения: 4484
Зарегистрирован: 13.03.2015,14:23
Откуда: Химки, М.О.

Вклад в сообщество

Сообщение pahan » 28.02.2018,18:03

Не очень понял задачу, но вот здесь вроде есть параметр, позволяюший распихать файлы по папкам, как на исходном сайте.

Аватара пользователя
ATauenis
Advanced Member
Сообщения: 5532
Зарегистрирован: 30.04.2015,21:30
Откуда: Москва
Контактная информация:

Вклад в сообщество

Сообщение ATauenis » 28.02.2018,20:38

pahan, задачу поняли верно, надо реанимировать кэш, чтобы страницы из него открывались не только в автономном режиме на компе, содержащем кэш, но и на других. IECacheView на справляется на 4-, ссылки (и картинки, стили, js) на другие домены остаются как есть. Но простые (однодоменные) сайты восстановил отлично. В целом, можно заменить http/https в файлах на адрес корневой папки с достанными страницами, и будет то, что надо. Скорее всего.

Ещё обнаружил недостаток. Ест только папку Temporary Internet Files, отдельно Content.IE5 не признаёт. Также не завелась на WinME.

Igor Michailov
Advanced Member
Сообщения: 1322
Зарегистрирован: 26.08.2012,13:09
Откуда: Москва

Сообщение Igor Michailov » 01.03.2018,10:13

Если задача посмотреть температуру в прошлые года, то можно на гисметео в разделе Дневник это сделать.

Например, 1 марта 2000 года в Москве была температура +5С

В целом же задача автоматического восстановления веб-страниц из кешей браузеров решается плохо. Как правило, после автоматического восстановления, страницы нуждаются в ручной обработке рашпилем (как в известном бородатом анекдоте).

Аватара пользователя
ATauenis
Advanced Member
Сообщения: 5532
Зарегистрирован: 30.04.2015,21:30
Откуда: Москва
Контактная информация:

Вклад в сообщество

Сообщение ATauenis » 01.03.2018,10:49

Не, дело не только в температуре. Интересно поностальгировать по старому виду выдачи Яндекса, страницам ВКонтакте вида задолго до моей регистрации там, блоку поиска в боковой панели IE, личным кабинетам модемных провайдеров и т.д.. Также в кэше вижу остатки update.microsoft.com для WinME, может, что-нибудь там будет полезное. Потом, когда отсортирую что можно выкладывать, а что нет, выложу у себя на сайте (в Web.Archive.Org всего этого нет и быть не может, многое требовало логины-пароли или скрыто в robots.txt).
Igor Michailov писал(а):В целом же задача автоматического восстановления веб-страниц из кешей браузеров решается плохо.
Однако, IE с этим отлично справляется, если включить автономный режим.

Руками его работа проделывается так:
1.) Поменять "[font=Courier]http://[/font]", "[font=Courier]"http://[/font]" и "[font=Courier]"//[/font]" на путь к папке восстановленных страниц.
2.) Распаковать что сжато Gzip'ом (самый сложный для автоматизации процесс, пока думаю, как его проделать грамотно).
3.) Подправить пути.
4.) Можно запускать машину времени :)
Изображение

Изображение

Ответить