- PVSM.RU - https://www.pvsm.ru -
Друзья, добро пожаловать! Ниже вас ждет история о том, как было проанализировано 20 миллионов доменных имен и что из этого вышло. Результаты можно посмотреть скачав csv-файл или восстановив дамп базы данных в PostgreSQL.
При желании можно поиграться с исходниками здесь [1] или сразу с контейнерами, используя
version: "2"
services:
app:
image: danieljust/domain-finder-v1
tty: true
ports:
- "3000:3000"
rabbit:
image: rabbitmq:3
db:
image: postgres
environment:
POSTGRES_PASSWORD: example
POSTGRES_USER: postgres
POSTGRES_DB: postgres
Инструкцию можно найти также на гитхабе [1]
Приятного чтения!
Все, что вы увидите и прочтете в данной статье, не является призывом и агитацией к домейнингу, а уж тем более к киберсквоттингу. Все действия были совершены ради интереса и, как говорится, «for fun».
У многих компаний, желающих провести ребрендинг или только-только выходящих на широкий рынок, возникает желание подобрать красивый домен.
Любопытства ради, было решено в качестве красивых доменов посмотреть короткие 1-3 символьные домены.
id | sldlength | tld | domain | price | roubleprice | available | definitive |
---|---|---|---|---|---|---|---|
1 | 1 | actor | 1.actor | 20000 | 1199520 | True | True |
id
— идентификатор записи
sldlength
— длина домена второго уровня
tld
— домен верхнего уровня
domain
— собственно доменное имя
price
— цена в долларах
roubleprice
— цена в рублях
available
— флаг, показывающий доступность домена
definitive
— флаг, показывающий был ли флагavailable
сверен с реестром
В процессе работы были замечены интересные сочетания доменных имен, ознакомиться с ними можно в таблице ниже.
domain | roubleprice |
---|---|
2.pizza | 47981 |
0.fail | 23991 |
a.xyz | 1199520 |
ab.xyz | 299880 |
ad.money | 11876 |
as.mba | 2400 |
as.guru | 11996 |
at.network | 23991 |
js.army | 47981 |
2.pizza — Идеально подойдет для начинающей пиццерии;
0.fail — для сверхнадежного чего-нибудь;
a.xyz, ab.xyz — для желающих быть поближе к гуглу;
ad.money — для рекламной площадки;
as.guru, as.mba — для консультационных фирм;
at.network — для фирм, связанных с администрированием сетей;
js.army — пролетарии всех стран, объединяйтесь.
Большинство двухсимвольных доменов, если и оказывались свободными, то их цена кусалась.
В двухсимвольных доменах верхнего уровня стран было найдено четыре свободных домена (все в чешской зоне), да и к тому же за небольшие деньги в 1000 рублей.
В трехсимвольных доменах верхнего уровня стран нашлось куда больше свободных и по доступной цене.
Количество общих доменов верхнего уровня многократно преобладает над доменами стран (домены стран составляют лишь 4% от общего числа свободных доменных имен)
За основу возможных символов в SLD были взяты -1234567890abcdefghijklmnopqrstuvwxyz
(всего 37 символов).
Выясняется, что имеем мы число размещений с повторениями p^n.
Итого $inline$ 37+37*37+37*37*37 = 52059 $inline$ вариантов.
Поскольку SLD не может начинаться и заканчиваться дефисом, исключим такие случаи и получим 49284.
Но это только начало.
Множество сайтов позволяют узнать, занят ли указанный домен через веб-интерфейс.
Для выполнения поставленной задачи ручного ввода данных явно недостаточно и требуется API, способное решить проблему.
В процессе поиска были встречены и отброшены следующие варианты:
Но душа хотела привнести что-нибудь полезное в мир open-source да еще и максимально бесплатно.
Решением проблемы стало данное API [2].
Его плюсы:
Его минусы:
Например, ответ API может содержать информацию, что сайт занят, и его нельзя купить. В это же время, данное доменное имя может быть доступно для покупки через UI.
В процессе общения с технической поддержкой, было выяснено, что при финальном подтверждении покупки выбранного домена, производится контрольная проверка его доступности.
Из наблюдений, флаг definitive
позволяет с большей вероятностью сделать вывод о занятости доменного имени.
С помощью API godaddy можно получить список TLD, в которых возможно приобрести доменные имена.
Из них выбираются TLD состоящие из одного слова (были убраны *.com.ru и т.д.). В итоге 400 TLD. Легкая арифметика приводит нас к $inline$ 49284*400 = 19 713 600 $inline$ доменов к проверке.
API godaddy может обработать до 500 доменов за 1 запрос, но имеет ограниченное количество запросов в 1 минуту.
В соответствии с вышесказанным, алгоритм работы программы был следующим:
Для удобства PostgreSQL и RabbitMQ были подняты как docker-контейнеры.
После того, как с работой скрипта было покончено, возникла необходимость выудить из полученных данных что-нибудь интересное и полезное.
Данные любезно помещены в domains.sql [3] и domains.csv [4].
Под фильтрацией в дальнейшем подразумевается поиск найденных SLD в списке самых частых английских сочетаний букв в соответствии с этим источником [5]
Из пары графиков выше, можно сделать вывод, что количество свободных доменных имен, содержащих частоупотребляемые сочетания букв английского алфавита стремится к нулю.
domain | roubleprice |
---|---|
ads.cloud | 11 906 200 |
vod.cloud | 11 852 400 |
usa.cloud | 11 852 400 |
seo.cloud | 11 852 400 |
vip.cloud | 11 852 400 |
domain | roubleprice |
---|---|
xt1.company | 590 |
xt1.casa | 590 |
xsz.company | 590 |
xt1.click | 590 |
xt1.business | 590 |
That's all Folks!
Прошерстив интернет было выявлено множество забавных доменов. А самое главное, что новым компаниям не стоит отчаиваться: интересные доменные имена все еще свободны, осталось их только увидеть.
Автор: danieljust
Источник [6]
Сайт-источник PVSM.RU: https://www.pvsm.ru
Путь до страницы источника: https://www.pvsm.ru/javascript/261757
Ссылки в тексте:
[1] здесь: https://github.com/hwdtech/domain-finder
[2] API: https://developer.godaddy.com
[3] domains.sql: https://www.dropbox.com/s/b1w188s0lp3ujsg/domains.sql?dl=0
[4] domains.csv: https://www.dropbox.com/s/7ks0zrk36dl29ru/domains.csv?dl=0
[5] источником: https://github.com/first20hours/google-10000-english
[6] Источник: https://habrahabr.ru/post/334992/?utm_source=habrahabr&utm_medium=rss&utm_campaign=sandbox
Нажмите здесь для печати.