Компания Яндекс — Технологии — Яндекс.Картинки и дубликаты изображений
Поиск по картинкам нужен в тех случаях, когда лучше увидеть, чем прочитать. Например, если надо узнать, как выглядит лиса [фенек], фотография зверька будет полезнее длинного текста про строение его ушей и длину хвоста. Иногда картинка — это хороший вспомогательный материал к основному ответу. Например, в результатах поиска по запросу [Айвазовский] будут присутствовать и репродукции его картин.
Яндекс ищет картинки через так или иначе связанный с ними текст, например, расположенное рядом с картинкой описание, её заголовок в html-коде страницы (и alt, и title), заголовок самой страницы или ссылка на картинку с другого сайта. Яндексу известны миллиарды изображений. Четверть из них — уникальные, а остальные — так называемые дубликаты, то есть картинки, которые не отличаются вообще или отличаются незначительно.
Точные дубликаты — абсолютно одинаковые изображения, которые не отличаются ни одним битом.Тумбнейлерные дубликаты (от англ. «thumbnail» — миниатюра) — изображения, которые различаются только размером, например, репродукция на сайте картинной галереи и маленькая картинка, которая на неё ссылается.
Полудубликаты — картинки c полупрозрачными надписями поверх изображения, незначительной цветокоррекцией, обрезкой или рамкой.
Расширенные полудубликаты — картинки с сильно измененными цветами или пропорциями, а также фрагменты исходных изображений.
У каждого изображения в интернете есть в среднем три дубликата. Чтобы результаты поиска Яндекс.Картинок не состояли из одинаковых изображений, сервис группирует дубликаты и показывает их в результатах поиска «стопками».
Чтобы компьютер мог понять, что изображено на картинках, и распознать дубликаты, изображения нужно «перевести» на понятный ему язык — язык чисел. В Яндекс.Картинках этим занимается специальная компьютерная система, программы которой обходят интернет, находят изображения и обрабатывают их: узнают необходимые данные о картинке, например, размер, цвет, формат (jpg, png и т.п.) и создают числовую характеристику изображения — сигнатуру.
На каждом изображении программа выделяет ключевые фрагменты. Затем уменьшает их до размера 16х16 пикселей, и каждому из 256 пикселей присваивает число, соответствующее яркости этого пикселя. Полученные комбинации чисел и есть сигнатуры.
Программа объединяет в группы изображения, у которых есть похожие ключевые фрагменты (то есть схожи их сигнатуры). Внутри этих групп выделяются еще более близкие изображения — у которых совпадают минимум два фрагмента. Изображения с похожими фрагментами становятся кандидатами в дубликаты. В них программа выделяет области, объединяющие все совпавшие фрагменты. Следующим шагом эти области уменьшаются до размера примерно 60х60 пикселей, переводятся в числовую характеристику и сравниваются между собой. Дубликатами признаются изображения, у которых области совпадают.
У большинства изображений в интернете есть текстовые описания — их и используют Яндекс.Картинки при поиске. Если дубликаты размещены на нескольких разных сайтах, то, скорее всего, у них существует несколько разных описаний. При группировке дубликатов изображения Яндекс.Картинки объединяют их описания. Это позволяет определять наиболее частые фрагменты описания, тем самым улучшая точность поиска.
Допустим, у фотографии длинного синего запорожца есть сорок дубликатов. Пятнадцать из них подписаны «запорожец», десять — «синий запорожец», пять — «зелёный запорожец» и ещё десять — «лимузин».
Если поделить количество упоминаний каждого слова в подписях на общее число картинок, получится, что степень правдоподобия описаний следующая:
[запорожец] — 0.75 (30 картинок из 40)
[синий] — 0.25 (10 картинок из 40)
[лимузин] — 0.25 (10 картинок из 40)
[зеленый] — 0.125 (5 картинок из 40)
Соответственно, эта фотография будет релевантным ответом на запросы [синий запорожец] или [запорожец лимузин], хотя последнего словосочетания изначально в описаниях не было. Если у дубликатов встречаются противоречащие друг другу описания, как «синий» и «зелёный» в этом примере, то выбирается наиболее частое.
Все дубликаты найденной картинки пользователи могут увидеть на странице просмотра изображения. Там есть список «Копии картинки» и ссылка на страницу со всеми известными Яндексу дубликатами. С помощью этого списка, пользователь может выбрать подходящий размер искомой картинки, автор изображения найти поклонников своего творчества, а веб-мастер — узнать, в каком фотобанке можно приобрести нужное изображение.
Распознавание дубликатов используется не только на сервисе Яндекс.Картинки. Например, оно помогает лучше определять сайты, содержащие материалы для взрослых, и учитывать их при включении семейного и умеренного фильтра. В базе сигнатур есть числовые характеристики изображений с порносайтов, известных Яндексу. Если сигнатуры новых картинок совпадают с ними, то ресурс, на котором они были найдены, подвергнется дополнительной проверке. Специальная программа изучит подозрительный сайт и подтвердит или опровергнет наличие на нём материалов для взрослых. Такие сайты и изображения с них пользователь может убрать из результатов поиска, включив фильтр «Семейный поиск».
Чаще всего пользователи копируют изображения знаменитостей и товаров. Количество дубликатов одного изображения — это может быть, например, фотография популярного сотового телефона — порой достигает нескольких десятков тысяч. Примерно на каждый сайт приходится 460 изображений. Средний размер одной картинки — 300х500 пикселей.
yandex.ru
Поиск похожих картинок или фотографий в интернете
Порой появляется необходимость найти похожие картинки или фото. К примеру, у вас есть фотография и вам надо найти ее в большом разрешении для того, чтобы распечатать или поставить в качестве обоев на рабочий стол. Без использования специальных сервисов поиск похожих изображений в интернете задача совсем не простая. В этой записи мы разберем несколько способов, которые позволят вам выполнять быстрый поиск похожих фото в Сети.
Быстрая навигация
Использование поисковой системы Google
Мало кто знает, но поисковая система Google даёт возможность выполнять поиск похожих изображений в интернете. Для этого надо зайти на google.ru и перейти в раздел « Картинки». Также на эту страницу можно попасть по ссылке https://images.google.ru
После того как вы зашли на страницу Гугл Изображения можно приниматься к поиску похожих изображений. Чтобы выбрать изображение для поиска надо нажать на значок в виде фотоаппарата.
В открывшемся окне вы можете указать прямую ссылку на нужное изображение или загрузить изображение с писишника.
Ещё вы можете просто перетащить нужное изображение в браузер с рабочего стола или любой папки. Когда вы начнете перетаскивать выбранный файлик, в браузере появится сообщение «Перетащите изображение сюда». Файлик с нужным изображением надо перетащить прямо на данный текст.
После этих манипуляций загрузятся результаты поиска.
Чтобы просмотреть найденные похожие изображения надо нажать на соответствующую ссылку в результатах поиска.
В основном, найденных похожих изображений очень много. Чтобы найти подходящую картинку воспользуйтесь функциями сортировки, которые расположены в левой части страницы. вы можете отсортировать изображения по дате публикации, размеру, цвету или типу.
Использование поисковой системы Yandex
У Яндекса всё не менее просто чем у Гугла
Переходите по ссылке https://yandex.ru/images/ и нажимайте значок фотоаппарата в верхнем правом углу:Укажите адрес изображения в сети интернет либо загрузите её с компа (можно простым перетаскиванием в специальную области в верхней части окна браузера):
Результат поиска выглядит таким образом:
Вы мгновенно получаете доступ к следующей информации:
- Какие в сети есть размеры изображения, которое вы загрузили в качестве образца для поиска;
- Список сайтов, на которых оно встречается;
- Похожие изображения (модифицированы на основе исходной либо по которым алгоритм принял решение об их смысловом сходстве).
Использование сервиса tineye.com
Если поиск похожих изображений в поисковой системе Гугл не дал результатов можно воспользоваться другими решениями. К примеру, online сервисом tineye.com.
Как и в предыдущем случае для того чтобы найти похожие изображения надо загрузить исходное изображение. Для этого надо указать прямую ссылку на картинку или загрузить файлик с компа. Функция простого перетаскивания файла также работает.
После того как изображения для поиска загружено сервис выдает результаты поиска похожих изображений. Доступно три способа сортировки результатов: Best Match (Лучшее совпадение), Most Changed (Больше всего изменений), Biggest Image (Большое разрешение).
PhotoTracker Lite – поиск 4 в 1
Расширение для браузера PhotoTracker Lite (работает в Гугл Хром, Opera с версии 36, Яндекс.Браузере, Vivaldi) даёт возможность в один клик искать похожие фото не лишь в указанных выше источниках, но и по базе поисковика Bing (Bing Images)!
Скрин интерфейса расширения:
В настройках приложения установите источники поиска, после чего щелкайте правой клавишей мышки на любое изображение в браузере и выбирайте опцию «Искать это изображение» PhotoTracker Lite:
Есть еще один способ поиска в один клик. По умолчанию в настройках приложения активирован пункт «Показывать иконку быстренького поиска». Когда вы наводите на какое-то фото или картинку, всплывает круглая зеленая иконка, нажатие на которую запускает поиск похожих изображений – в новых вкладках автоматически откроются результаты поиска по Google, Yandex, TinEye и Bing.
Расширение создано нашим соотечественником, который по роду увлечений тесно связан с фотографией. Первоначально он создал данный инструмент, чтобы быстренько находить свои фото на чужих сайтах.
Когда это может быть нужным
- Вы являетесь фотографом, выкладываете свои фото в интернет и хотите увидеть на каких сайтах они используются и где возможно нарушаются Ваши авторские права.
- Вы являетесь блогером или копирайтером, пишите статьи и хотите подобрать к своему материалу «незаезженное» изображение.
- А вдруг кто-то использует Ваше фото из профиля Вконтакте или Фейсбук в качестве аватарки на форуме или фальшивой учетной записи в какой-либо социальной сети? А ввиду того, что такое более чем возможно!
- Вы нашли фотку знакомого актера и хотите всне забывть как его зовут.
На самом деле, случаев, когда может пригодиться поиск по снимки, огромное множество. Можно еще привести и такой пример…
Как найти оригинал заданного изображения
К примеру, у вас есть какая-то фотка, возможно кадрированная, пожатая, либо отфотошопленная, а вы хотите найти её оригинал, или вариант в лучшем качестве. Как это сделать? Проводите поиск в Яндекс и Гугл, как описано выше, либо средствами PhotoTracker Lite и получаете список всех найденных изображений. Далее руководствуетесь следующим:
- Оригинальное изображение, как правило имеет больший размер и лучшее качество по сравнению с измененной копией, полученной в результате кадрирования. Разумеется можно в фотошопе выставить картинке любой размер, но при его увеличении относительно оригинала, всегда будут наблюдаться артефакты. Их можно легко заметить даже при беглом визуальном осмотре.
Статья в тему: Как изменить размер изображения без потери в качестве. - Оригинальные снимки частенько имеют водяные знаки, обозначающие авторство снимка (фамилия, адрес сайта, название компании и пр.). Разумеется водяной знак может добавить кто угодно на абсолютно на любое изображение, но в этом случае можно поискать образец фото на сайте или по фамилии автора, должно быть он где-то выкладывает своё портфолио online.
- Если ваш образец фото черно-белый (сепия и пр.), а вы нашли такую же, но полноцветную фотку, то у вас явно не оригинал. Добавить цветность ч/б снимки гораздо более сложнее, чем перевести цветную фотку в черно-белую
Видео о том, как найти похожую картинку
Видео про поиск по картинке в Яндекс
it-territoriya.ru
Поиск по картинке или фото в google, яндекс и tineye, как искать похожие картинки
Существует несколько онлайн-сервисов, позволяющих найти во всемирной паутине картинки подобные Вашей. Рассмотрим 3 из них – Гугл, Яндекс и TinEye, отличающихся огромными базами данных проиндексированных изображений. Все загруженные фото и URL изображений хранятся на серверах указанных сервисов, это требуется для улучшения качества их работы.
Поиск фото поможет найти похожие изображения. Это весьма полезная функция, к примеру, если Вам требуется получить максимальное визуальное представление о товаре, который, желаете купить.
Если у Вас имеется образец картинки, то Вы узнаете, как можно найти аналогичную и возможно ли это сделать. Также покажем, как найти сайты, содержащие картинку Вашего запроса или подобные. А еще узнаем, как искать такие же изображения, но других размеров.
Как искать похожие картинки в гугл
Прежде всего загрузим страницу сайта images.google.com в браузере. Кстати обозреватель следует использовать по возможности наиболее актуальных версий на данный момент. Например, Google Chrome с 5 версии и старше, Internet Explorer – никак не младше 9 версии, Firefox 4.0 и выше.
Нажимаем на иконку с камерой. Откроется поиск по фото, которую можно, как загрузить с устройства (либо просто перетащить его в поле поиска), так и дать на неё ссылку в сети в виде URL адреса.
Дождавшись загрузки файла, откроются результаты, в которых найдете такие же изображения, но других размеров (если они есть), похожие изображения в виде перечня картинок внизу, а также
В браузерах Chrome и Firefox есть возможность прямо на сайте нажать правой кнопкой по изображению и в меню выбрать пункт Найти в Гугл, результаты будут аналогичные предыдущему методу.
Ищем картинки в Яндекс
Принцип работы поиска в яндексе, yandex.ru/images, аналогичен.
Такая же кнопка с камерой, нажав которую можно выбрать фото, перетащить или указать её адрес.
В данном случае Яндекс выдал нам больше результатов, чем Гугл. Это объясняется тем, что Яндекс хранит больше изображений с рунета, а гугл – остального англоязычного интернета.
Похожие картинки в tineye
На сервисе Tineye хранится огромная база данных картинок, которые были проиндексированы.
Все просто – жмём на кнопку со стрелкой для загрузки файла с компьютера, или указываем Image URL, то есть адрес фото.
Загрузятся результаты в том же виде, как и в предыдущих случаях.
Следует учитывать, что сервис является англоязычным, но интуитивно понятным.
Читайте также:
composs.ru