Чтобы посмотреть можно ли получать исходные коды со всех страниц я хочу скачать чо нибудь с сервиса http://commoncrawl.org/
В нем есть небольшой недостаток (нифига не понятно): не совсем удобно реализован парсинг страниц. Сперва надо зарегистрироваться на амазон, а уже потом качать не более 5 гб в один поток...
Почитал в интернетах, пишут, что при регистрации в амазоне кто вводит им карточку всегда попадают на проблему списывания сумм с карточки. У кого то перегруз по ресурсам, кому-то надо было удалять бесплатный аккаунт, он забыл, у кого-то ваще вопреки всякой логике деньги буржуи сперли. Вопросы:
0. Может у кого есть акк на амазоне, посмотрите, там можно качать хтмл код сайтов?
1. Кто регистрировался на амазоне, сопрут там деньги или нет?