исследование рэп что это

Слова-приметы русского рэпа

Аналитики Яндекса подготовили большое исследование про русский рэп. Они взяли тексты, доступные на Яндекс.Музыке, и нашли самые характерные слова — для русского рэпа в целом, для отдельных исполнителей и для разных периодов, с начала девяностых по наши дни. Здесь мы собрали пять фактов из исследования, а его полную версию можно посмотреть по этой ссылке. Кстати, это первое исследование Яндекса с пометкой «18+» — потому что из песни слов не выкинешь.

Наиболее характерные слова для рэпа — собственно рэп и хип-хоп.

Рэперы вообще много говорят о своей музыке и процессе её производства. В текстах они постоянно упоминают микрофоны, треки, альбомы, рифмы и бит — эти слова так же характерны для жанра, как обсценная лексика.

Самые типичные персонажи рэп-текстов — рэпер и братик.

За ними в порядке убывания популярности следуют MC, бро и хейтер. А ещё в русском рэпе гораздо чаще, чем в других жанрах, упоминаются названия брендов: айфоны, найки и гуччи, мерины и бумеры.

Самые характерные (слева) и самые нехарактерные (справа) персонажи русского рэпа

Пик употребления мата в русском рэпе пришёлся на вторую половину 2000-х.

В девяностые доля мата в рэп-текстах была не сильно больше, чем в остальных произведениях. Затем она заметно выросла и достигла пика в 2006–2010 гг. — в этот период мат звучал в рэпе в 17 раз чаще, чем в музыке других жанров.

Заимствования — примета последних лет.

Доля слов, позаимствованных из английского языка, начала расти примерно в начале десятых годов. Особенно много их в списке характерных слов за два последних года: это хайп, блант, кэш, коп, трип, хейтер и прочее.

Басту можно узнать не только по Ростову, но и по пуэру

Гуф чаще других рэперов употребляет слова кузня, планчик, по-моему, абсолютно и нормально. Тимати — бизнесмен, статус, график, чикса и потанцевать. Скриптонит — вкуривать, поц, шпек и хапка.

На странице исследования есть карта русского рэпа. Она показывает лексические связи между рэперами: чем больше у двух исполнителей общих характерных слов, тем ближе друг к другу они находятся. Бонусом — рэп, сочинённый Автопоэтом.

Источник

Русский рэп как набор слов

6 ноября 2018. По данным Яндекс.Музыки

Наши коллеги из The Pudding как-то нарисовали карту англоязычного хип-хопа. Мы решили, что про русский рэп тоже надо сделать такое исследование, — и сделали немного больше. Мы взяли тексты, доступные на Яндекс.Музыке, и нашли самые характерные и самые нехарактерные слова — для жанра вообще и для конкретных рэперов. Посмотрели, какие слова были в моде в разные годы. Сделали тест, в котором надо угадать, кому подражала нейросеть, когда писала строчки вроде «Я горожанин Мордора. На пиру — не сняв ошейника». Карту русского рэпа тоже нарисовали.

В этом исследовании мы изучали тексты, которые были доступны на Яндекс.Музыке в июле 2018 года. Рэпом считали то, что помечено в каталоге сервиса как рэп.

Слова, характерные для жанра в целом

Для каждого слова посчитали, как часто оно встречается в текстах рэперов и всех остальных исполнителей. Чтобы не завышать частотность слов, которые много повторяются в одной песне (например, в припеве), слово учитывали только один раз для каждого трека. Первую частотность делили на вторую — чем больше полученный показатель, тем более характерным для рэпа считали слово. Учитывали только глаголы, существительные и прилагательные, которые встречаются в обоих корпусах.

Чтобы найти самые рэповые строки, мы брали все слова из каждой строчки, складывали их показатели характерности для рэпа и делили на число слов. Чем выше средняя характерность, тем более рэповой считали строчку. Самые нерэповые строчки искали аналогичным образом.

Эпохи

Чтобы составить топы характерных слов для эпох, мы разделили все треки на пять групп по времени выпуска, а затем для каждой группы нашли слова, которые встречаются в текстах соответствующего периода гораздо чаще, чем в среднем за всё время.

Исполнители

Характерные слова искали для рэперов, входящих в топ-250 популярных на Яндекс.Музыке, для которых на сервисе было доступно не менее десяти треков с текстом. Для этого использовали метрику TF-IDF. В качестве документа брали весь репертуар исполнителя, в качестве корпуса — все доступные на сервисе тексты рэперов из топа-250. Чтобы не завышать частотность слов из припевов и других рефренов, мы снова засчитывали слову только одно вхождение для каждого трека, в котором оно звучит.

Для поиска характерной песни применили ту же метрику для каждого трека исполнителя, только теперь считали все упоминания слов в треке, предварительно удалив повторяющиеся строки. Самым характерным треком считали тот, вектор характерности слов которого оказался ближайшим к вектору исполнителя по косинусному расстоянию.

Карта русского рэпа

Полученные векторы исполнителей использовали для составления карты русского рэпа: чем меньше косинусное расстояние между векторами, тем ближе два исполнителя на карте.

Популярные слова

ПО ДАННЫМ ЯНДЕКС.МУЗЫКИ

Самые характерные и нехарактерные слова

Потом мы решили определить самые-самые характерные и нехарактерные слова — без оглядки на то, как часто их используют. Чтобы найти их, мы снова сравнивали частотность использования того или иного слова в рэпе и в других жанрах, но теперь уже не ограничивались рэперским топом-500.

исследование рэп что это. Смотреть фото исследование рэп что это. Смотреть картинку исследование рэп что это. Картинка про исследование рэп что это. Фото исследование рэп что это исследование рэп что это. Смотреть фото исследование рэп что это. Смотреть картинку исследование рэп что это. Картинка про исследование рэп что это. Фото исследование рэп что это исследование рэп что это. Смотреть фото исследование рэп что это. Смотреть картинку исследование рэп что это. Картинка про исследование рэп что это. Фото исследование рэп что это исследование рэп что это. Смотреть фото исследование рэп что это. Смотреть картинку исследование рэп что это. Картинка про исследование рэп что это. Фото исследование рэп что это исследование рэп что это. Смотреть фото исследование рэп что это. Смотреть картинку исследование рэп что это. Картинка про исследование рэп что это. Фото исследование рэп что это

ПО ДАННЫМ ЯНДЕКС.МУЗЫКИ

ПО ДАННЫМ ЯНДЕКС.МУЗЫКИ

Рассчитав показатели характерности отдельных слов, мы смогли отобрать строчки, максимально насыщенные рэпом. Потом мы отдали эти строчки автопоэту, чтобы получить сверхрэповые четверостишия. В основном получается не очень: строчки разных авторов плохо уживаются вместе. Но бывают и удачи. Интересно, что самые нерэповые строчки соединяются заметно лучше, как будто это детали из одного набора.

Эпохи

Примеры характерных слов для разных периодов

Примеры набраны из топа-15 существительных, прилагательных и глаголов, характерных для каждого периода.

ПО ДАННЫМ ЯНДЕКС.МУЗЫКИ

В девяностые доля матерных слов в текстах рэперов была не сильно выше, чем в песнях представителей других жанров. В начале двухтысячных она заметно выросла и достигла пика во второй половине нулевых, одновременно с началом широкого употребления сленга. Тогда в рэпе мат звучал в семнадцать раз чаще, чем в музыке других жанров, в последние годы — примерно в десять раз. Выше всего доля мата в треках Фейса, THRILL PILL, Сявы, «Кровостока» и Big Russian Boss.

Исполнители

Кто бы мог это написать?

Определив характерные слова для всех исполнителей, мы нашли для каждого трек с самым высоким содержанием таких слов. Например, для «Триагрутрики» это песня «Биг сити лайф», а для ATL — «Планета Железяка».

Источник

Яндекс. Музыка показала самые популярные слова в лексиконе русских рэперов

исследование рэп что это. Смотреть фото исследование рэп что это. Смотреть картинку исследование рэп что это. Картинка про исследование рэп что это. Фото исследование рэп что это

Сервис Яндекс.Музыка нарисовал карту самых популярных слов в русском рэпе. Посмотреть ее и почитать исследование сервиса можно здесь.

Как это делалось? «Для каждого слова посчитали, как часто оно встречается в текстах рэперов и всех остальных исполнителей (брались только тексты, доступные на Яндекс.Музыке — прим. The Flow). Чтобы не завышать частотность слов, которые много повторяются в одной песне (например, в припеве), слово учитывали только один раз для каждого трека. Первую частотность делили на вторую — чем больше полученный показатель, тем более характерным для рэпа считали слово. Учитывали только глаголы, существительные и прилагательные, которые встречаются в обоих корпусах».

Какие самые популярные слова у рэперов? «Наиболее характерными словами для рэпа и хип-хопа оказались, собственно, рэп и хип-хоп. Рэперы вообще много говорят о своей музыке и о процессе её производства. Слова трек, микрофон, бит, рифма или, например, альбом так же характерны для жанра, как обсценная лексика или жаргон — тачка, хата и прочее. Наименее характерны для рэпа слова луна, весна, птица, дождь, река, крыло, тишина, сердце и так далее».

исследование рэп что это. Смотреть фото исследование рэп что это. Смотреть картинку исследование рэп что это. Картинка про исследование рэп что это. Фото исследование рэп что это

Кроме этого сервис может показать самые популярные слова в творчестве отдельного исполнителя — для этого надо подставить в соответствующую графу его имя.

Источник

Бессмысленный и беспощадный. Аналитики «Яндекса» составили карту русского рэпа

Лента новостей

Все новости »

Компания выпустила исследование о наиболее характерных и нехарактерных словах в текстах рэперов, а также разделила лексикон по годам: от 1991 до 2018 года

«Яндекс» разделил историю русского рэпа на пять периодов и для каждого нашел слова, которые в этот период употребляли намного чаще, чем в другие. Девяностые оказались очень похожи по духу на начало двухтысячных: рэперы много говорили про уличную жизнь, драки и битвы, гордились слогом, ждали наград, искали истину.

Вторая половина нулевых отличается распространением сленга вроде «рэпчика», тогда же стали «мутить» и «убиваться». С начала десятых в топах стало больше заимствований из английского, особенно много их в списке характерных слов последнего периода: «хайп», «блант», «кэш», «коп», «трип», «хейтер» и прочее.

Менялась и доля матерных слов в текстах рэперов. В девяностых она была не сильно выше, чем в песнях представителей других жанров. В начале двухтысячных заметно выросла и достигла пика во второй половине нулевых, одновременно с началом широкого употребления сленга. Тогда в рэпе мат звучал в 17 раз чаще, чем в музыке других жанров, в последние годы — примерно в десять раз. Выше всего доля мата в треках Фейса, THRILL PILL, Сявы, «Кровостока» и Big Russian Boss.

Самые типичные персонажи для современных российских рэп-текстов — «рэпер» и «братик», среди нетипичных — «старушка» и «цыганка». Место действия — «студия» или «блок», но никак не «луг» и не «тайга». Рэп-животные — это «зая» и «псина» (антиподы — «соловей» и «журавль»). Еще в рэпе гораздо чаще, чем в других жанрах, упоминаются названия брендов, в первую очередь «найки» и «гуччи», «мерины» и «бумеры», а также «айфоны». Другим жанрам просто нечем ответить.

Характерные слова можно найти и для отдельных представителей русского рэпа. Например, тексты Басты можно узнать по частому упоминанию «Ростова» и «пуэра». Характерные слова для Гуфа — «кузня», «нормально», «планчик», «Москва-река» и «абсолютно»; для Тимати — «бизнесмен», «статус», «график», «чикса» и «танцевать»; для Славы КПСС — «бытие», «хайп» и «Россия».

По итогам исследования автопоэт «Яндекса» научился составлять «сверхрэп» (строчки, максимально насыщенные русским рэпом). Из печатного: «Я нагнул вас всех, если бабки есть, трать. Уверен, это будет успех, рэп прочитать — жизнь прочитать».

Источник

Рэпометр: пересечение аудиторий российских рэперов в YouTube от Yoloco

Год назад мы в Yoloco провели небольшое исследование — выявили пересечения аудиторий российских рэп-исполнителей в Instagram. Сегодня покажем вам пересечения аудитории рэперов в YouTube.

Тогда это исследование вызвало большой интерес, причём не только в индустрии диджитал-маркетинга, но и за ее пределами. Наш пост в Facebook репостнули известные издания в сфере маркетинга, например DNative, а некоторые рэперы пообсуждали наше исследование в Twitter — тут.

Интерес был вызван в первую очередь тем, что пересечение аудиторий у лидеров мнений даёт представление о реальных охватах. В дальнейшем мы первыми на рынке реализовали инструмент быстрого пересечения аудиторий на нашей платформе. Сегодня наши клиенты могут за 5-10 минут пересечь аудиторию выбранных блогеров, узнать, сколько у них одинаковых подписчиков и принять решение, стоит ли работать с этими блогерами или нет.

Самое сложное в пересечениях аудиторий — собрать данные. За год мы прокачали нашу технологию и теперь умеем собирать не только данные по миллионам подписчиков в Instagram, но и комментарии в YouTube.

Yoloco сфокусировался на сборе комментариев, потому что вся ценная информация об активности аудитории и её реакциях содержится именно там. За год мы разработали собственную модель автоматического определения тональности текста и теперь можем проверить комментарии на негатив и позитив за несколько секунд.

Ценность для брендов заключается в первую очередь в возможности двигаться дальше в оценке реального объема активной аудитории, с которой они планируют взаимодействие. Это повышает точность медиапланирования и выбора нужного инфлюенсера.

В итоге решили провести похожее исследование пересечений аудиторий, но уже в YouTube. В этот раз мы будем пересекать комментаторов, а не подписчиков. Итак, поехали!

Мы отобрали 20 популярных рэп-исполнителей из РФ и стран СНГ. Для отбора финального списка рэперов проделали следующие шаги:

У оставшихся 20 исполнителей мы проанализировали 7,8 млн комментариев под 2000 видеороликов. У каждого исполнителя взяли все видеоролики и собрали все комментарии (без ответов на комментарии, только верхний уровень) под ними. Также нашли для каждого рэп-исполнителя такой показатель, как процент реплаев, то есть ответов на комментарий. Эта метрика говорит нам о том, как часто подписчики создают новые ветки обсуждения, отвечают другу другу. Косвенно, процент реплаев указывает нам на качество и глубину обсуждения под роликами.

Лидер по проценту реплаев — рэпер FACE. Его подписчики часто отвечают друг друг — более 38% комментариев. Меньше всего общаются друг с другом подписчики канала лейбла «Газгольдер». Лишь 16% поклонников Басты и его артистов отвечают друг другу, создавая новые ветки в комментариях.

Если один и тот же пользователь YouTube оставил комментарий под каналом А и каналом Б, мы засчитывали это как пересечение. В итоге получилось 5,2 млн связей «комментатор — канал». Всего мы проанализировали 3,9 млн уникальных комментаторов, то есть около 4 млн людей хотя бы один раз комментировали ролики выбранных рэп-исполнителей.

Самый старый комментарий, который попал в выборку был сделан 18 октября 2008 года под клипом группы Каста. Самый последний комментарий, который попал в выборку, был сделан 27 ноября 2020 года. Его оставили под роликом Моргенштерна «Хова ответил… / Читаю под биты (Versus BPM)». Ролик был сделан давно, но его до сих пор комментируют.

Мы проанализировали изменение эмоционального окраса комментариев во времени. Чтобы это сделать, определили для каждого комментария 4 параметра: дату создания, видеоролик, к которому относится комментарий, YouTube-канал, где выложен этот видеоролик, и тональность комментария — позитивную или негативную. Для определения тональности использовали собственную модель тональности Yolority.

Также мы собрали облако комментариев для каждого исполнителя и покажем в этой статье облако всех комментариев под видеороликами исполнителей.

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *