Соционический форум SOCIOCLUB.ORG - Соционика и психософия (психе-йога)

Соционический форум SOCIOCLUB.ORG

Соционика и психософия (психе-йога)

Соционический форум SOCIOCLUB.ORG »   Проблемы и методы типирования »   Соционика »   Контент-анализ по ключевым словам
RSS

Контент-анализ по ключевым словам

<<Назад  Вперед>>Страницы: 1 *
Модераторы: Kath, srez
Печать
 
4X_Pro
Здешних мест хозяин
Философ и Воин Интернета
4X_Pro

ТИМ: ЛИИ ("Робеспьер")
ПЙ-тип: нет

Откуда: Москва, Перово
Всего сообщений: 7162
Рейтинг пользователя: 217


Ссылка


Дата регистрации на форуме:
2 июня 2006
К сожалению, не очень хорошо представляю себе, как работает фильтр Байеса.
У меня была такая идея: сначала тупая проверка по заданным ключевым словам, потом, когда это будет работать нормально, сделать еще накопление информации о часто встречающихся словах (чтобы их потом можно было тоже сопоставить аспектам).
Светлая
Долгожитель форума

Светлая

ТИМ: ЭСИ ("Драйзер")
ПЙ-тип: ФВЭЛ

Всего сообщений: 3824
Рейтинг пользователя: 362

Репутация пользователя: 1

Ссылка


Дата регистрации на форуме:
7 июня 2006

slonoslon написал:
[q]

XXXX Pro написал:
[q]
Оффтопик: А кто Пушкин по соционическому типу?
[/q]


чаще всего в Гексли и Напы типируют.
[/q]

Гексли определенно
kaprizka
Долгожитель форума
Сказка
kaprizka

ТИМ: ЛИИ ("Робеспьер")
ПЙ-тип: нет

Откуда: 56°E58°N
Всего сообщений: 1635
Рейтинг пользователя: 173


Ссылка


Дата регистрации на форуме:
16 июля 2006

slonoslon написал:
[q]
у Толстого частота "я" 0.78%, "он" 1.66%
у Пушкина соответственно 1.37% и 1.03%
[/q]


А какие тексты сравнивались?
Если у одного проза, у другого поэзия - то сравнение некорректно.
Да и в прозе слово "я" будет встречацца в зависимости не от социотипа, а от способа повествования - от первого или от третьего лица. Ессно, один автор может по-разному в разных книгах поступить.

Можно было бы предлоги сравнивать, но тут возможно влияние времени: разные авторы жили в разные моменты, а язык со временем меняется.

Кстати, какой социотип может сказать фразу:
"Некрасивая работа никому не нужна"?



slonoslon
Долгожитель форума

slonoslon

ТИМ: ИЛИ ("Бальзак")
ПЙ-тип: нет

Всего сообщений: 4288
Рейтинг пользователя: 423

Репутация пользователя: 1

Ссылка


Дата регистрации на форуме:
13 авг. 2006
У Толстого - "Война и мир", первый том. У Пушкина - "романы и повести". Проза и там и там. С по-разному в разных книгах - для серьезного исследования, разумеется, надо все доступное творчество прогонять. Я просто поленился прикручивать качалку, которая пройдется по всем текстам автора. Но думаю, что все-таки есть устойчивые склонности писать от первого или от третьего лица. И подсклонности, касающиеся предпочтительного способа изображения мыслей и слов героев. Хотя и риск нарваться на исключения тоже есть, и он тем выше, чем меньше текстов анализируется.
Вот, кстати, еще одна такая неполная статистика:
Маркес, Сто лет одиночества.
частота "я" = 0.0935%

Andre
Участник проекта

Andre

ТИМ: ЛИИ ("Робеспьер")
ПЙ-тип: нет

Откуда: г.Кемерово
Всего сообщений: 1903
Рейтинг пользователя: 105

Репутация пользователя: 1

Ссылка


Дата регистрации на форуме:
25 июля 2006
Про фильтр Байеса можно прочитать в инете (если ты еще этого не сделал). Спаморезки с адаптивными фильтрами его используют... Имхо, для контент анализа очень адекватная вещь.
Механик
Долгожитель форума



ТИМ: Не типирован
ПЙ-тип: нет

Всего сообщений: 936
Рейтинг пользователя: -30


Ссылка


Дата регистрации на форуме:
17 апр. 2007

XXXX Pro написал:
[q]
Недавно мне дали идею - сделать автоматизированный контент-анализатор. Причем чисто технически это довольно несложно, причем даже можно сделать с учетом словоформ. Основная проблема - это составить словари.Соответственно, у меня два вопрос такой: а) занимался ли этим кто-нибудь прежде и насколько эффективен этот метод, б) кто может помочь с составлением словарей для анализа, особенно по тем аспектам, которые для меня чужды.
[/q]

В соционике-то, Для тЕпирования?
Вотъ

http://www.geshtalt.ru/psycholingvist_author.php

А вообще для научных исследований, в том числе в области психологии и психоанализа - И.В.Фоменко, профессор филологии Тверского университета.
Фоменко составляет частотный (определяющий число повторений каждого слова) словарь служебных слов (предлоги, союзы и частицы) того или иного произведения и на основании всей этой 'шелухи' (т.е. второстепенных элементов) определяет мироощущения автора, в котором тот сам может не отдавать себе отчета. Дело в том, что когда пишутся значимые, знаменательные слова, работает сознание автора. При написании служебных слов срабатывает подсознание.
Например, при анализе пространственных предлогов (в, на, к, от, над, под и т.д.) получаются очень интересные результаты. Александр Блок в поэме 'Двенадцать' неимоверное число раз употребляет наречие 'вперед', которое у него звучит как у Маяковского. Однако нет ни одного предлога, который означал бы нечто, расположенное впереди или движущееся вперед. Не является ли это подсознательным стремлением к небытию, в котором ничего нет?

PS
Механику подход Фоменко представляется гораздо более прагматичным, направленным на решение насущных задач встающих перед человеком в в его повседневной жизни
Полный спесок публикаций Фоменко

http://ktl.nm.ru/fomenko.htm
Wic
Участник проекта

Wic

ТИМ: ИЛИ ("Бальзак")
ПЙ-тип: ЛФВЭ

Откуда: Piter
Всего сообщений: 1642
Рейтинг пользователя: 205

Репутация пользователя: 1

Ссылка


Дата регистрации на форуме:
2 авг. 2006
На Оргиях когда-то давно такой проект был - составляли списки достоверно затипированных товарищей чтобы потом прога собрала статистику по их постам с целью поиска кореляций.

Не в курсе, чем все это закончилось.
<<Назад  Вперед>>Страницы: 1 *
Модераторы: Kath, srez
Печать
Выводить сообщения

Соционический форум SOCIOCLUB.ORG »   Проблемы и методы типирования »   Соционика »   Контент-анализ по ключевым словам
RSS
Быстрый переход в раздел:

Вы не можете отправлять сообщения
Вы не можете создавать темы
Вы не можете голосовать в опросах
Вы не можете создавать опросы
Вы не можете редактировать свои сообщения
Вы не можете прикреплять к сообщениям файлы
Вы не можете модерировать раздел
Вы не можете видеть IP-адреса

1 посетитель просмотрел эту тему за последние 15 минут
В том числе: 1 гость, 0 скрытых пользователей


Время выполнения скрипта: 0.6082. Количество выполненных запросов: 19, время выполнения запросов 0.5026
Rambler's Top100 Психология 100