Базы данных в формате вопрос-ответ для тренировки чат бота
Этот вопрос узко-направленный. Для тех кто занимается нейросетями. Давайте делиться базами данных, чтобы научить бота понимать троллинг, шутки, опечатки. Для этого нужна база данных настоящих переписок людей в соцсетях. В качестве затравки http://panchenko.me/data/
Вот еще интересная статья https://habrahabr.ru/company/dca/blog/274027/ там тоже есть ссылка на базу данных с твиттера. Ищу больных этой идеей в хорошем смысле. Возможно написать парсер, который мониторит переписки на разных сайтах, пополняя базу. Идея такая чтобы сделать открытый корпус разговорных диалогов на русском языке
email: docplanetasite@gmail.com
skype: ernest_faizullin
telegram, wire: erniesto77
Я тут на днях башорг распарсил. Надо?
Куда делся ваш репозиторий? Он мне очень нужен
все базы залью на github https://github.com/02-web/russian-dialog-corpus
меня может здесь не быть, проявляйте инициативу и заливайте свои базы в этот репозиторий. В итоге может получиться очень полезно всем
напиши телеграмм бота. Много неравнодушных добавят его в свои группы(наверное)