Парсим и ресайзим аватарки из пс выдачи яндекса

Получать картинки будем из кеша chrome. Наша задача состоит не только в том, чтобы выдернуть картинки из кеша браузера, но и перевести их из формата webp в jpg, отресайзить до 100px по сторонам, удалив из них не пропорциональные, а именно те, где ширина или высота менее/более 15% от 100px. А затем окончательно отресайзим их до пропорции 100×100 пикселей.

ChromeCacheView — простенькая утилитка, которая позволит нам получить линки на файлы картинок в сети. Чистим весь кеш в браузере, открываем страницу выдачи картинок, мотаем вниз нужное нам приблизительно кол-во. Открываем программку, в опциях оставляем только картинки и сортируем по дате доступа.

К сожалению, остальных фильтров покруче тут нет, поэтому не мудрствуя лукаво, выделяем все записи и копируем все url что выдала программа. Для этого: CTRL+A и CTRL+U

Вставляем url в текстовый файлик и сохраняем его.

Грепнем по созданному файлу в новый файл только то, что необходимо по шаблону:

С вновь созданным файлом url.txt идём на linux систему и остальные действия выполним уже на ней.

Командная строка, ваш выход:

Готово.

UPD: все манипуляции выше, можно сделать одной командой. Для этого накатал специальный скрипт под Linux: https://github.com/avtobys/ava_parser

  1. Чистим полностью кеш в лисе
  2. Открываем выдачу яндекса и мотаем вниз заполняя кеш
  3. Запускаем команду указанную в readme
  4. Указываем любое имя для zip архива
  5. Complete!

 

Оставить комментарий

Ваш адрес email не будет опубликован.