Угадайте кодировку: I?eaao

alumnus
Уже с Приветом
Posts: 315
Joined: 14 Mar 2003 22:35

Угадайте кодировку: I?eaao

Post by alumnus »

С одного hotmail адреса в мой Outlook 2003 пришло писмо начинающееся так:
I?eaao
Известно, что это слово "Привет", но раскодировать все письмо пока не могу - дело не только (и не столько) в кодировке, так как это явно испорченный текст при переводе с Unicode или обратно. Есть идеи как перекодировать? Разные программки с автоопределением уже пробовал...
User avatar
SVK
Уже с Приветом
Posts: 8249
Joined: 23 Jul 2003 03:53
Location: SPb - KW - NY - CT - MD

Re: Угадайте кодировку: I?eaao

Post by SVK »

alumnus wrote:С одного hotmail адреса в мой Outlook 2003 пришло писмо начинающееся так:
I?eaao
Известно, что это слово "Привет", но раскодировать все письмо пока не могу - дело не только (и не столько) в кодировке, так как это явно испорченный текст при переводе с Unicode или обратно. Есть идеи как перекодировать? Разные программки с автоопределением уже пробовал...


Похоже на конверсию Win-1251 ----> Western European (ISO)
Привет! ---> Ïðèâåò!
LG - Life's good.
But good life is much better.
alumnus
Уже с Приветом
Posts: 315
Joined: 14 Mar 2003 22:35

Post by alumnus »

Так как вы предлагаете расшифровать письмо?
User avatar
SVK
Уже с Приветом
Posts: 8249
Joined: 23 Jul 2003 03:53
Location: SPb - KW - NY - CT - MD

Post by SVK »

alumnus wrote:Так как вы предлагаете расшифровать письмо?


Как я понимаю, текст был в кодировке Win-1251, а заголовок сообщения указывал какой-нибудь Western European. Например, отправлено с Yahoo Mail, или любого "ненашего" почтового Web-сервера.

Если те "а-умляуты", которые там должны быть, еще раз не исковерканы последующим преобразованием, то должно сработать переключение (в новом Outlook - версии 9 - есть в меню: Encoding). Там стоит, видимо, Western European? - переключить в Cyrillic Win-1251

Но в старом Outlook это не работало, и там безвозвратно изменялся текст в соответствии с тем, что поставлено в заголовке пришедшего сообщения. Я с этим часто мучался. Не помогал уже ни Schtilitz, ни Forward на другой адрес... В Outlook 9 это исправили, наконец.
LG - Life's good.
But good life is much better.
alumnus
Уже с Приветом
Posts: 315
Joined: 14 Mar 2003 22:35

Post by alumnus »

Нет, никакое переключение ни в IE ни в Outlook2003 не помогает. Да и не должно - буквы то все ASCII - они везде одинаковыми будут. Естесственно где-то произошла перекодировка,т.е. изменение самого body письма а не заголовка.
User avatar
SVK
Уже с Приветом
Posts: 8249
Joined: 23 Jul 2003 03:53
Location: SPb - KW - NY - CT - MD

Post by SVK »

alumnus wrote:Нет, никакое переключение ни в IE ни в Outlook2003 не помогает. Да и не должно - буквы то все ASCII - они везде одинаковыми будут. Естесственно где-то произошла перекодировка,т.е. изменение самого body письма а не заголовка.


Ну, если "галочки" ("умляуты") уже пропали - то надо сливать воду, и тушить свет...
LG - Life's good.
But good life is much better.
User avatar
CTAC_P
Уже с Приветом
Posts: 6789
Joined: 01 Jun 2001 09:01

Post by CTAC_P »

SVK wrote:
alumnus wrote:Нет, никакое переключение ни в IE ни в Outlook2003 не помогает. Да и не должно - буквы то все ASCII - они везде одинаковыми будут. Естесственно где-то произошла перекодировка,т.е. изменение самого body письма а не заголовка.


Ну, если "галочки" ("умляуты") уже пропали - то надо сливать воду, и тушить свет...

Ну, зачем так сразу. Надо взять для начала рассказ о Шерлоке Холмсе "Пляшушие человечки" почитать. ;)
Hamster
Уже с Приветом
Posts: 11475
Joined: 20 Nov 2000 10:01
Location: Escondido, CA

Post by Hamster »

CTAC_P wrote:Ну, зачем так сразу. Надо взять для начала рассказ о Шерлоке Холмсе "Пляшушие человечки" почитать. ;)


Нужно найти хороший wordlist и разобраться в принципе преобразования. После этого большинство слов будет однозначно определяться.
alumnus
Уже с Приветом
Posts: 315
Joined: 14 Mar 2003 22:35

Post by alumnus »

Hamster wrote:
CTAC_P wrote:Ну, зачем так сразу. Надо взять для начала рассказ о Шерлоке Холмсе "Пляшушие человечки" почитать. ;)


Нужно найти хороший wordlist и разобраться в принципе преобразования. После этого большинство слов будет однозначно определяться.


Вы предлагаете вручную все расшифровать?
Hamster
Уже с Приветом
Posts: 11475
Joined: 20 Nov 2000 10:01
Location: Escondido, CA

Post by Hamster »

alumnus wrote:Вы предлагаете вручную все расшифровать?


Нет, я предлагаю написать программу.
User avatar
CTAC_P
Уже с Приветом
Posts: 6789
Joined: 01 Jun 2001 09:01

Post by CTAC_P »

alumnus wrote:
Hamster wrote:
CTAC_P wrote:Ну, зачем так сразу. Надо взять для начала рассказ о Шерлоке Холмсе "Пляшушие человечки" почитать. ;)


Нужно найти хороший wordlist и разобраться в принципе преобразования. После этого большинство слов будет однозначно определяться.


Вы предлагаете вручную все расшифровать?

Вручную, или с применением средств малой механизации, типа транслитерации в Perl
User avatar
wolfboy
Уже с Приветом
Posts: 1224
Joined: 24 Feb 2003 07:40

Post by wolfboy »

shtirlitz 3.0 - И будет вам щастье!
trudogolik
Уже с Приветом
Posts: 427
Joined: 04 Mar 2003 04:46
Location: San Francisco, CA

Post by trudogolik »

Можно copy-paste вот сюда:
http://www.artlebedev.ru/tools/decoder/

Справлялся с разным...
Только фрагмент должен быть длиннее, чем Вы привели, чтобы ему было легче догадаться про осмысленность текста. С этим он не справился.
User avatar
A. Fig Lee
Уже с Приветом
Posts: 12072
Joined: 17 Nov 2002 03:41
Location: английская колония

Re: Угадайте кодировку: I?eaao

Post by A. Fig Lee »

alumnus wrote:С одного hotmail адреса в мой Outlook 2003 пришло писмо начинающееся так:
I?eaao
Известно, что это слово "Привет", но раскодировать все письмо пока не могу - дело не только (и не столько) в кодировке, так как это явно испорченный текст при переводе с Unicode или обратно. Есть идеи как перекодировать? Разные программки с автоопределением уже пробовал...


RFC 1342

An "encoded-word" is more precisely defined by the following EBNF
grammar, using the notation of RFC 822:

encoded-word = "=" "?" charset "?" encoding "?" encoded-text "?" "="
Верить нельзя никому - даже себе. Мне - можно!
alumnus
Уже с Приветом
Posts: 315
Joined: 14 Mar 2003 22:35

Post by alumnus »

wolfboy wrote:shtirlitz 3.0 - И будет вам щастье!


Программы такие все очень тупые - никакое автоопределение не помогает. А какую входную и выходную кодировку задавать - непонятно. Ни одна комбинация не работает.
alumnus
Уже с Приветом
Posts: 315
Joined: 14 Mar 2003 22:35

Post by alumnus »

trudogolik wrote:Можно copy-paste вот сюда:
http://www.artlebedev.ru/tools/decoder/

Справлялся с разным...
Только фрагмент должен быть длиннее, чем Вы привели, чтобы ему было легче догадаться про осмысленность текста. С этим он не справился.


Попробовал - не помогает. Что-то преобразовывывает но нечитабельно.
alumnus
Уже с Приветом
Posts: 315
Joined: 14 Mar 2003 22:35

Re: Угадайте кодировку: I?eaao

Post by alumnus »

A. Fig Lee wrote:
alumnus wrote:С одного hotmail адреса в мой Outlook 2003 пришло писмо начинающееся так:
I?eaao
Известно, что это слово "Привет", но раскодировать все письмо пока не могу - дело не только (и не столько) в кодировке, так как это явно испорченный текст при переводе с Unicode или обратно. Есть идеи как перекодировать? Разные программки с автоопределением уже пробовал...


RFC 1342

An "encoded-word" is more precisely defined by the following EBNF
grammar, using the notation of RFC 822:

encoded-word = "=" "?" charset "?" encoding "?" encoded-text "?" "="


Ну и что?
User avatar
A. Fig Lee
Уже с Приветом
Posts: 12072
Joined: 17 Nov 2002 03:41
Location: английская колония

Re: Угадайте кодировку: I?eaao

Post by A. Fig Lee »

alumnus wrote:
A. Fig Lee wrote:
alumnus wrote:С одного hotmail адреса в мой Outlook 2003 пришло писмо начинающееся так:
I?eaao
Известно, что это слово "Привет", но раскодировать все письмо пока не могу - дело не только (и не столько) в кодировке, так как это явно испорченный текст при переводе с Unicode или обратно. Есть идеи как перекодировать? Разные программки с автоопределением уже пробовал...


RFC 1342

An "encoded-word" is more precisely defined by the following EBNF
grammar, using the notation of RFC 822:

encoded-word = "=" "?" charset "?" encoding "?" encoded-text "?" "="


Ну и что?

Что - что?
Вы же письмо не раскодировали?
Посмотрите хедер.
Верить нельзя никому - даже себе. Мне - можно!
User avatar
SVK
Уже с Приветом
Posts: 8249
Joined: 23 Jul 2003 03:53
Location: SPb - KW - NY - CT - MD

Post by SVK »

Скорее всего, в исходном сообщении были такие тэги в заголовке (пример для сообщений с Yahoo):

Content-Type: text/plain
Content-Transfer-Encoding: 7bit

Тогда эти "7 bit" точно испортили все к чертовой матери - поэтому и "а-умляуты" превратились в простые "а"

Есть возможность извлечь Message Source, чтобы хоть что-то понять?

* * *

А вообще, поскольку это не слишком большое/важное/уникальное сообщение (видимо?), то самый простой способ - обратиться к отправителю с просьбой послать его еще раз, на другой адрес, или с исправленным заголовком, или в другой кодировке, и т.д.
LG - Life's good.
But good life is much better.
alumnus
Уже с Приветом
Posts: 315
Joined: 14 Mar 2003 22:35

Post by alumnus »

Вот что говорит хедер:

Content-Type: text/plain; format=flowed

Это у писем с hotmail. У писем с yahoo.com на русском -

Content-Type: text/plain; charset=us-ascii

Похоже, что либо outlook, либо exchange server все корежат.

Return to “Вопросы и новости IT”