Но когда я собрался скопировать текст статьи про косовский кризис, оказалось, что сделать это не так-то просто. На Альдебаране страницы защищены от копирования (текст просто невозможно выделить). С предыдущей статьей я вроде бы тоже на это натыкался, и тогда взял текст с FictionBook.ru. Попытался и теперь найти там нужную статью - ан нет, часть страниц пустые, и как раз нужной статьи там нет. И Яндексом текст не нашелся, даже тот, что на самом Альдебаране.
Ладно, думаю, будем бороться с Альдебараном. Не дает копировать с экрана - залезу в исходный код страницы.
Залез. Текста там нет. Видимо, грузится и вставляется откуда-то сбоку.
Решил сохранить на диск, чтобы иметь дело с файлом. Если сохранять только html, то получается именно тот код, в котором нет текста. Сохранил страницу целиком, с картинками и прочей требухой. Ура, там есть текст. Копирую, вставляю, готово...
Нет, какая-то фигня - в половине слов лишние символы:
Косово каквю миф и историческицй факт заниемало общественноъще мнение на Западе в теъчение всего XX века. Косовский воптррос уже в начале срXX века стал слжужить политиуко-пропагандистскким целям. Через историю оэ Косове сербы и вСербия, каэзк союзники Запада, видерйлись храбрымт народом и страной, зъаслужившелйй почетное место в исбктории Европы. Во время Первой мировойбэ войны в Великобританиилу, Франции и США проходили цтраурные митингли в честь годовщизяны Косовскойб битвы. В то время уистория о Косове, Сербии и ее нщароде представлялагрсь прекраснойш и героической[114]. Однако в тощечение последнего деоясятилетия XX века западные СМИ и общестмжвенность демонизщрируют Сербию и бсербский народ именнобш из-за косовскоьпго вопроса, дграссматриваемнцого теперь сквосзь призму актуалрьного албано-сербсквбого конфлирикта. В этой стцатье автор рассказываерт о начале иуо ходе этнического шстолкновения вяд Косове и о попыэтках управлять икфм (ethnic conflict management), предприююнимавшихся прежней югзославской комвмунистической вывластью, сегоднряшней сербской влацстью, вождяйэми косовских ашлбанцев и междунсародным сообщутеством.
Выходит, для защиты от особо сообразительных повставляли лишних символов. Вычищать вручную можно, но тоскливо.
Смотрю в файл. Выглядит это так:
Косово как<SPAN class="h">вю</SPAN> миф и исторически<SPAN class="h">ц</SPAN>й факт зани<SPAN class="h">е</SPAN>мало общественно<SPAN class="h">ъщ</SPAN>е мнение на Западе в те<SPAN class="h">ъ</SPAN>чение всего XX века. Косовский воп<SPAN class="h">тр</SPAN>рос уже в начале <SPAN class="h">ср</SPAN>XX века стал сл<SPAN class="h">ж</SPAN>ужить полити<SPAN class="h">у</SPAN>ко-пропагандистс<SPAN class="h">к</SPAN>ким целям. Через историю о<SPAN class="h">э</SPAN> Косове сербы и <SPAN class="h">в</SPAN>Сербия, ка<SPAN class="h">эз</SPAN>к союзники Запада, виде<SPAN class="h">рй</SPAN>лись храбрым<SPAN class="h">т</SPAN> народом и страной, з<SPAN class="h">ъ</SPAN>аслуживше<SPAN class="h">лй</SPAN>й почетное место в ис<SPAN class="h">бк</SPAN>тории Европы...
То есть лишние символы вставлены при помощи конструкции <SPAN class="h">. При просмотре в браузере исходной страницы их не видно, при копировании лезут. Ну, с этим можно справиться - достаточно в редакторе найти и заменить регулярные выражения вида <SPAN class="h">*</SPAN>. После этого уже получился текст, пригодный для выкладывания в ЖЖ.
И лишь на следующий день до меня дошло, что я не просто преодолел техническую трудность, а нарушил права правообладателя, поскольку разместил в публичном доступе текст, для этого не предназначенный и явным образом защищенный. Так что теперь, ежели издатели сочтут нужным обратиться в органы, грозные борцы с пиратством нагрянут и возьмут меня тепленьким.