1. Общие условия использования рекомендательных технологий сайта www.osnmedia.ru
Настоящие правила применения рекомендательных технологий на сайте www.osnmedia.ru (далее — «Правила» и «Сайт» соответственно) устанавливают условия и правила применения рекомендательных технологий на Сайте, в том числе описывают: – процессы и методы сбора, систематизации, анализа сведений, относящихся к предпочтениям пользователей Сайта, предоставления информации на основе этих сведений, а также способов осуществления таких процессов и методов; – виды сведений, относящихся к предпочтениям пользователей Сайта, которые используются для предоставления информации с применением рекомендательных технологий, источники получения таких сведений. Сайт представляет собой систему интерактивного обслуживания в режиме реального времени, эксплуатируемую АНО “Медиахолдинг «Общественная служба новостей» в информационно-телекоммуникационной сети «Интернет» и включающую в себя информационные услуги и данные, предоставляемые АНО “Медиахолдинг «Общественная служба новостей» и третьими лицами.
2. Термины и определения
2.1. Рекомендательная технология – это информационные технологии предоставления информации на основе сбора, систематизации и анализа сведений, относящихся к предпочтениям пользователей сети “Интернет”, находящихся на территории Российской Федерации.
2.2. Внутренняя рекомендательная технология – это рекомендательная технология, которая разработана и принадлежит АНО “Медиахолдинг «Общественная служба новостей».
2.3. Внешняя рекомендательная технология – это рекомендательная технология, которая внедрена на Сайте, но не разработана и не принадлежит АНО “Медиахолдинг «Общественная служба новостей». В Правилах будут размещен перечень внешних рекомендательных технологий и ссылки на их ресурсы с Правилами.
3. Описание процессов и методов сбора, систематизации, анализа сведений, относящихся к предпочтениям пользователей Сайта
3.1. Метод работы внутренней рекомендательной технологии Сайта
3.2. Гибридная модель рекомендаций с латентным представлением
3.2.1. Модель изучает вложения (латентные представления в многомерном пространстве) для пользователей и элементов таким образом, чтобы кодировать предпочтения пользователей к элементам. При умножении этих представлений между собой получаются оценки для каждого элемента для данного пользователя; элементы с высокими оценками более вероятно будут интересны пользователю. Иными словами, для каждого пользователя алгоритм ищет других пользователей с похожими паттернами поведения, и рекомендует тот контент, который эти пользователи посмотрели.
3.2.2. После просмотра статьи пользователю предлагается вкладка «Рекомендуем» с перечнем новостных статей, исходя из его предпочтений.
3.3. Модель на основе трансформеров
3.3.1. Данный подход применяется, если пользователь новый на Сайте. Модель формирует самые популярные новостные статьи по теме и предлагает их пользователю. Например, пользователю, прочитавшему новостную статью об обществе, будут предложены похожие популярные новости на общественную тематику.
3.3.2. После просмотра статьи, пользователю предлагается такая же вкладка «Рекомендуем», но с перечнем самых популярных новостных статей по теме, сформированных самостоятельно рекомендательной технологией.
3.4. Метод работы внешних рекомендательных технологий, внедренных на Сайте
Перечень внешних рекомендательных технологий с ссылками на их ресурсы с правилами:
3.4.1. Внешняя рекомендательная технология «Infox» – https://cis.infox.sg/p/recommendation.html;
3.4.2. Внешняя рекомендательная технология «СМИ2» – https://smi2.ru/ (или Приложение 1 текущих правил);
3.4.3. Внешняя рекомендательная технология «Sparrow» – https://sparrow.ru/recommendation-technologies.html;
3.4.4. Внешняя рекомендательная технология «Мир тесен» – https://mirtesen.ru/ (или Приложение 2 текущих правил);
3.5 При взаимодействии с одной из перечисленных технологий, пользователя переадресовывают на общую страницу внешней рекомендательной системы, которая, в свою очередь, предлагает различные новостные статьи по теме.
4. Виды сведений, относящихся к предпочтениям пользователей Сайта и алгоритмы работы с ними.
4.1. Для каждого пользователя создается уникальный идентификатор, который привязан к браузеру – его можно сбросить, почистив cookies. Сайт не обрабатывает персональные данные пользователей в целях обеспечения работы рекомендательных технологий.
4.2. Данный идентификатор собирает данные о страницах, которые посещал пользователь, а также, данные о заголовках, времени создания публикации, разделах, рейтингах и количестве комментариев. Эти данные отправляются на сервер Сайта, где сохраняются в базе данных для дальнейшего обучения модели рекомендаций.
4.3. Пользователи, впервые посетившие Сайт, не получают персональных рекомендаций из-за отсутствия уникального идентификатора, таким пользователям показываются одинаковые общие рекомендации.
4.4. Пользователи, которые ранее заходили на Сайт, благодаря уникальному идентификатору и данным о просмотренных страницах, могут получать персональные рекомендации.
4.5. На Сайте при просмотре той или иной статьи пользователю предлагается колонка «Материалы по теме» – данный раздел не является рекомендательной технологией, так как каждому пользователю предлагается одинаковые статьи по теме.
5. Заключительные положения
5.1. Оставаясь на Сайте, пользователь подтверждает, что ознакомлен и согласен с Правилами.
ПРИЛОЖЕНИЕ 1. Правила пользования СМИ2 (smi2.ru)
ПРАВИЛА применения рекомендательных технологий в виджетах рекламно-обменной сети «СМИ2», размещенных на сайте www.ru»
1. Термины и определения
«Сайт» Совокупность программ для электронных вычислительных машин и иной информации, содержащейся в информационной системе, доступ к которой обеспечивается посредством информационно-телекоммуникационной сети “Интернет” (далее – сеть “Интернет”) по доменным именам и (или) по сетевым адресам, позволяющим идентифицировать сайты в сети “Интернет”.
«Доменное имя»
Обозначение символами, предназначенное для адресации сайтов в сети “Интернет” в целях обеспечения доступа к информации, размещенной в сети “Интернет”;
«Рекомендательные технологии» процессы и методы сбора, систематизации, анализа сведений, относящихся к предпочтениям пользователей сети “Интернет”, предоставления информации на основе этих сведений, а также способы осуществления таких процессов и методов.
«Баннер», «Текстово-графический блок», виджет» модуль, содержащий визуальные образы (векторные и растровые изображения) и/или текстовые сообщения, выполненный в формате gif или flash.
«ПЭВМ» представленная в объективной форме совокупность данных и команд, предназначенных для функционирования ЭВМ и других компьютерных устройств в целях получения определенного результата, включая подготовительные материалы, полученные в ходе разработки программы для ЭВМ, и порождаемые ею аудиовизуальные отображения
ПЭВМ «Информационная рекламно-обменная сеть СМИ2», ПЭВМ 1 ПЭВМ, предназначенная для организации обмена интернет-трафиком между сайтами онлайн-медиа; монетизации трафика сайта и размещения рекламы на сайтах, исключительные права, на которую принадлежат ООО «СМИ2» (ОГРН 1117746655355) (внесена в Реестр программ для ЭВМ, регистрационный № 2020615032 от 14.05.2020 г.)
«ПЭВМ Система анализа аудитории интернет-проектов Stat.Media», ПЭВМ 2 ПЭВМ, предназначенная для анализа и сбора данных о взаимодействии аудитории с Сайтом, и, в частности, о показах контента на Сайте и «кликах» по нему, исключительные права, на которую принадлежат ООО «СМИ2» (ОГРН 1117746655355) (внесена в Реестр программ для ЭВМ, регистрационный № 2020615037 от 14.05.2020 г.)
«База данных» представленная в объективной форме совокупность самостоятельных материалов (статей, расчетов, нормативных актов, судебных решений и иных подобных материалов), систематизированных таким образом, чтобы эти материалы могли быть найдены и обработаны с помощью электронной вычислительной машины (ЭВМ).
«База данных «Потоковые данные программного продукта «Информационная рекламно-обменная сеть СМИ2» база данных, содержащая потоковые данные о показах и кликах по новостям и рекламным объявлениям сети, о показах виджетов сети, исключительные права, на которую принадлежат ООО «СМИ2» (ОГРН 1117746655355) (внесена в Реестр баз данных, регистрационный № 2020620816 от 21.05.2020 г.)
«База данных программного продукта «Система анализа аудитории интернет-проектов Stat.Media» база данных, содержащая данные о взаимодействии аудитории с Сайтом, и, в частности, о показах контента на Сайте и «кликах» по нему, исключительные права, на которую принадлежат ООО «СМИ2» (ОГРН 1117746655355) (внесена в Реестр баз данных, регистрационный № 2020620834 от 22.05.2020 г.)
«Интернет-площадка (Площадка)» интернет-сайт, мобильное приложение, на которых до сведения Пользователей сети «Интернет» при помощи ПЭВМ «Информационная рекламно-обменная сеть СМИ2» доводится контент информационного и рекламного содержания, включая, но не ограничиваясь, сайты, приложения, мобильные сайты, мобильные приложения и иные интернет-площадки, права администрирования которых и (или) права на размещение контента на которых принадлежат администратору Сайта и (или) уполномоченному им лицу и доступные для просмотра и (или) взаимодействия посредством конечных устройств любых пользователей сети «Интернет».
«Пользователь сети «Интернет» обезличенный посетитель Площадки, идентифицируемый ПЭВМ 1 и ПЭВМ 2, имеющий уникальный идентификатор и профиль, находящийся на территории Российской Федерации.
Если из контекста не вытекает иное, любой термин, не определенный в настоящих Правилах, имеет то значение, которое установлено для него законодательством Российской Федерации и обычаем.
2. Содержание рекомендательных технологий:
Описание процессов и методов сбора, систематизации, анализа сведений, относящихся к предпочтениям пользователей сети “Интернет”, предоставления информации на основе этих сведений, а также способов осуществления таких процессов и методов.
а) Площадка автоматически, с учётом персональных рекомендаций, посредством интегрированного программного кода ПЭВМ «Информационная рекламно-обменная сеть СМИ2», осуществляет круглосуточно в непрерывном режиме демонстрацию виджетов правообладателя ПЭВМ «Информационная рекламно-обменная сеть СМИ2».
б) Посредством «ПЭВМ «Информационная рекламно-обменная сеть СМИ2»; «ПЭВМ «Система анализа аудитории интернет-проектов Stat.Media» осуществляется сбор данных, в соответствии с функциональным назначением, указанным в части 1 настоящих Правил в целях обработки и последующего хранения в Базе данных «Потоковые данные программного продукта «Информационная рекламно-обменная сеть СМИ2» и Базе данных программного продукта «Система анализа аудитории интернет-проектов Stat.Media».
ПЭВМ 1, ПЭВМ 2 в автоматическом режиме обрабатывает полученные данные и формирует на основе предпочтений пользователей сети «Интернет» «персонализированный» контент.
в) При нажатии Пользователя на демонстрируемый посредством ПЭВМ 1 на Сайте контент, в Базу данных сохраняется информация о тематике такого контента.
Каждой новости в ПЭВМ 1 и (или) ПЭВМ 2 соответствует определённый набор тематик. Этот набор определяется ПЭВМ 1 и (или) ПЭВМ 2 на основе содержания новости.
г) Собирая сведения о новостях, переход на который произвел Пользователь, ПЭВМ 1 и (или) ПЭВМ 2 накапливает в Базе данных информацию о Пользователе сети «Интернет» и интересующих его новостных тематиках, что образует «профиль» Пользователя.
д) В момент очередного наполнения (формирования новостной выдачи) виджета для Пользователя ПЭВМ 1 и (или) ПЭВМ 2 учитывает и (или) стремится учитывать сведения о том, какие тематики интересовали Пользователя сети «Интернет», и увеличивать вероятность показа новостей тематик профиля такого Пользователя.
Виды сведений, относящихся к предпочтениям пользователей сети “Интернет”, которые используются для предоставления информации с применением рекомендательных технологий, источники получения таких сведений К сведениям, относящимся к предпочтениям пользователей сети “Интернет” относится тематика демонстрируемого посредством ПЭВМ 1 на Сайте контента, выбранного Пользователем путем нажатия и перехода на источник такого контента и полученные посредством автоматической работы модулей ПЭВМ 1 и (или) ПЭВМ 2.
ПРИЛОЖЕНИЕ 2. Правила пользования МИР ТЕСЕН (mirtesen.ru)
ПРАВИЛА применения рекомендательных технологий социальной рекомендательной сети МИРТЕСЕН
Термины и определения
«Сайт» Совокупность программ для электронных вычислительных машин и иной информации, содержащейся в информационной системе, доступ к которой обеспечивается посредством информационно-телекоммуникационной сети “Интернет” (далее – сеть “Интернет”) по доменным именам и (или) по сетевым адресам, позволяющим идентифицировать сайты в сети “Интернет”, расположенный по адресу mirtesen.ru
«Доменное имя»
Обозначение символами, предназначенное для адресации сайтов в сети “Интернет” в целях обеспечения доступа к информации, размещенной в сети “Интернет”;
«Рекомендательные технологии» процессы и методы сбора, систематизации, анализа сведений, на Сайте, относящиеся к предпочтениям пользователей сети “Интернет”, предоставления информации на основе этих сведений, а также способы осуществления таких процессов и методов.
«Пользователь сети «Интернет» в целях применения настоящих Правил обезличенный посетитель Сайта, находящийся на территории Российской Федерации.
Если из контекста не вытекает иное, любой термин, не определенный в настоящих Правилах, имеет то значение, которое установлено для него законодательством Российской Федерации и обычаем.
1. Содержание рекомендательных технологий:
Описание процессов и методов сбора, систематизации, анализа сведений, относящихся к предпочтениям пользователей сети “Интернет”, предоставления информации на основе этих сведений, а также способов осуществления таких процессов и методов.
На проекте Миртесен используется контент предоставляемый партнерскими СМИ, а также зарегистрированными пользователями социальной рекомендательной сети.
Для рекомендации контента используются следующие атрибуты:
• Подписки
• Категории
• Теги
• Гео-теги
Используются два типа сбора предпочтений пользователя:
• Ручная установка пользователем
• Геопозиционирование
• Автоматический сбор предпочтений
Ручная установка пользователем
Пользователь может непосредственно влиять на механизм рекомендации, указав свои предпочтения и исключения в настройках.
Механизм рекомендации расставляет веса статьям в выдаче. Статьям, которые обладают атрибутами, указанными пользователем в его предпочтениях, повышается вес. Статьи, которые обладают атрибутами, указанными пользователем в его исключениях, понижаются в выдаче.
Геопозиционирование
(в разработке)
При посещении проекта зарегистрированным пользователем, проект получает данные о местоположении пользователя, на основе этих данных пользователю предлагается выбрать географический регион, новости которого его интересуют. Если у пользователя такие регионы указаны, то материалам относящимся к данному региону повышается вес.
Автоматический сбор предпочтений
На основании действий пользователя собираются автоматические предпочтения пользователей – атрибуты из материалов, с которыми взаимодействует пользователь, собираются в вектора интересов. При формировании рекомендованной ленты материалов вектора интересов пользователя влияют на вес материала в персональной выдаче.
Виды сведений, относящихся к предпочтениям пользователей сети “Интернет”, которые используются для предоставления информации с применением рекомендательных технологий, источники получения таких сведений К сведениям, относящимся к предпочтениям пользователей сети “Интернет” относится:
• Подписки
• Категории
• Теги
• Гео-теги
Используются два типа сбора предпочтений пользователя:
• Ручная установка пользователем
• Геопозиционирование
• Автоматический сбор предпочтений