Инфоурок Литература Научные работыОтчёт по созданию и анализу частотного словаря повести Н.В.Гоголя "Шинель".

Отчёт по созданию и анализу частотного словаря повести Н.В.Гоголя "Шинель".

Скачать материал

Министерство науки и высшего образования РФ

ФГБОУ ВО «Бурятский государственный университет имени Доржи Банзарова»
Институт филологии, иностранных языков и массовых коммуникаций

 

 

 

 

 

 

 

 

 

 

СОЗДАНИЕ ЧАСТОТНОГО СЛОВАРЯ

 

 

 

 

Выполнил студент гр.18100з

Меркулова Л.В.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Улан-Удэ

2021 г.


I.       Характеристика  частотного словаря

Частотный словарь повести Н.В.Гоголя «Шинель»

С помощью программы WebScript выявлена частота слов в тексте, частотный список сохранен в программе MS Excel.

Проведена лемматизация частотного списка: для этого список был отсортирован в программе MS Excel в алфавитном порядке, каждая словоформа из списка приведена к своей лемме.

Из частотного списка удалены цифры, ссылки.

Таким образом, созданный частотный словарь содержит 10072 слов, из которых уникальных – 2486 слов.

Для каждого слова определена частота встречаемости в тексте (в %).

 

II. Анализ наиболее частотных слов

Диаграмма Ципфа для частотного словаря выглядит следующим образом:

Согласно закону Ципфа первые 15-20%  слов частотного словаря - это слова, составляющие лексический минимум корпуса.

В лексический минимум вошли 368 слов (15% частотного словаря), из них самое высокочастотное слово встречается 426 раз, самое низкочастотное – 5раз.

Для каждого слова из лексического минимума определена часть речи:

Слово

Количество

Частота встречаемости в тексте

Часть речи

1.      

и

426

союз

17,136%

2.      

в

258

предлог

10,378%

3.      

не

207

частица

8,327%

4.      

он

181

местоимение

7,281%

5.      

на

171

предлог

6,879%

6.      

быть

157

глагол

6,315%

7.      

что

124

союз

4,988%

8.      

как

111

наречие

4,465%

9.      

какой

94

местоимение

3,781%

10.  

чтоб

93

союз

3,741%

11.  

Акакий

92

существительное

3,701%

12.  

Акакиевич

90

существительное

3,620%

13.  

такой

74

местоимение

2,977%

14.  

с

70

предлог

2,816%

15.  

а

69

союз

2,776%

16.  

все

68

союз

2,735%

17.  

который

66

предлог

2,655%

18.  

то

66

союз

2,655%

19.  

к

60

предлог

2,414%

20.  

по

57

предлог

2,293%

21.  

ему

56

местоимение

2,253%

22.  

его

55

местоимение

2,212%

23.  

но

55

союз

2,212%

24.  

один

54

числительное

2,172%

25.  

товарищ

52

существительное

2,092%

26.  

Петрович

51

существительное

2,051%

27.  

едва

48

наречие

1,931%

28.  

за

46

предлог

1,850%

29.  

садился

45

глагол

1,810%

30.  

шинельный

45

прилагательное

1,810%

31.  

даже

43

частица

1,730%

32.  

это

43

частица

1,730%

33.  

мог

41

глагол

1,649%

34.  

тот

41

местоимение

1,649%

35.  

самый

39

прилагательное

1,569%

36.  

бы

38

частица

1,529%

37.  

лицо

37

существительное

1,488%

38.  

чиновник

36

существительное

1,448%

39.  

дайте

35

глагол

1,408%

40.  

сказать

35

глагол

1,408%

41.  

так

35

союз

1,408%

42.  

человек

35

существительное

1,408%

43.  

же

33

частица

1,327%

44.  

новый

33

прилагательное

1,327%

45.  

всякий

32

прилагательное

1,287%

46.  

когда

32

наречие

1,287%

47.  

да

31

частица

1,247%

48.  

дело

30

существительное

1,207%

49.  

слово

30

существительное

1,207%

50.  

день

28

существительное

1,126%

51.  

руки

28

существительное

1,126%

52.  

дом

27

существительное

1,086%

53.  

только

27

союз

1,086%

54.  

желание

26

существительное

1,046%

55.  

потом

26

наречие

1,046%

56.  

ни

25

частица

1,006%

57.  

ужин

25

существительное

1,006%

58.  

чтобы

25

союз

1,006%

59.  

видеть

24

глагол

0,965%

60.  

у

24

предлог

0,965%

61.  

этот

24

частица

0,965%

62.  

значительно

23

наречие

0,925%

63.  

сделать

23

глагол

0,925%

64.  

уже

23

частица

0,925%

65.  

улица

23

существительное

0,925%

66.  

говорить

22

глагол

0,885%

67.  

нибудь

22

союз

0,885%

68.  

уж

22

частица

0,885%

69.  

время

21

существительное

0,845%

70.  

департамент

21

существительное

0,845%

71.  

если

21

союз

0,845%

72.  

еще

21

наречие

0,845%

73.  

недавно

21

наречие

0,845%

74.  

она

21

местоимение

0,845%

75.  

тоже

21

союз

0,845%

76.  

всегда

20

наречие

0,805%

77.  

ею

20

местоимение

0,805%

78.  

либо

20

союз

0,805%

79.  

несколько

20

местоимение

0,805%

80.  

ничего

20

местоимение

0,805%

81.  

свой

20

местоимение

0,805%

82.  

будет

19

глагол

0,764%

83.  

избежание

19

существительное

0,764%

84.  

или

19

союз

0,764%

85.  

потому

19

наречие

0,764%

86.  

стать

19

глагол

0,764%

87.  

кто

18

местоимение

0,724%

88.  

лучше

18

наречие

0,724%

89.  

наконец

18

наречие

0,724%

90.  

об

18

союз

0,724%

91.  

своя

18

местоимение

0,724%

92.  

та

18

местоимение

0,724%

93.  

без

17

предлог

0,684%

94.  

вот

17

частица

0,684%

95.  

ее

17

местоимение

0,684%

96.  

раз

17

существительное

0,684%

97.  

сам

17

существительное

0,684%

98.  

совершенное

17

причастие

0,684%

99.  

совершенной

17

деепричастие

0,684%

100.                     

шинель

17

существительное

0,684%

101.                     

вдруг

16

наречие

0,644%

102.                     

глаз

16

существительное

0,644%

103.                     

из

16

предлог

0,644%

104.                     

комната

16

существительное

0,644%

105.                     

свои

16

местоимение

0,644%

106.                     

будто

15

союз

0,603%

107.                     

весьма

15

наречие

0,603%

108.                     

где

15

наречие

0,603%

109.                     

именно

15

частица

0,603%

110.                     

место

15

существительное

0,603%

111.                     

от

15

предлог

0,603%

112.                     

очень

15

наречие

0,603%

113.                     

через

15

предлог

0,603%

114.                     

я

15

местоимение

0,603%

115.                     

во

14

предлог

0,563%

116.                     

воротник

14

существительное

0,563%

117.                     

вышел

14

глагол

0,563%

118.                     

голова

14

существительное

0,563%

119.                     

два

14

числительное

0,563%

120.                     

мертвец

14

существительное

0,563%

121.                     

нельзя

14

наречие

0,563%

122.                     

нет

14

СЧР

0,563%

123.                     

плечи

14

существительное

0,563%

124.                     

взять

13

глагол

0,523%

125.                     

вроде

13

предлог

0,523%

126.                     

него

13

местоимение

0,523%

127.                     

ним

13

местоимение

0,523%

128.                     

нужно

13

наречие

0,523%

129.                     

сильный

13

прилагательное

0,523%

130.                     

убивать

13

глагол

0,523%

131.                     

чубуков

13

существительное

0,523%

132.                     

бумага

12

существительное

0,483%

133.                     

вечер

12

существительное

0,483%

134.                     

вид

12

существительное

0,483%

135.                     

выбежали

12

глагол

0,483%

136.                     

для

12

предлог

0,483%

137.                     

знать

12

глагол

0,483%

138.                     

мере

12

существительное

0,483%

139.                     

могила

12

существительное

0,483%

140.                     

небольшой

12

прилагательное

0,483%

141.                     

о

12

СЧР

0,483%

142.                     

пошел

12

глагол

0,483%

143.                     

сторона

12

существительное

0,483%

144.                     

темнота

12

существительное

0,483%

145.                     

ужас

12

существительное

0,483%

146.                     

более

11

наречие

0,442%

147.                     

больше

11

наречие

0,442%

148.                     

видно

11

наречие

0,442%

149.                     

иметь

11

глагол

0,442%

150.                     

минута

11

существительное

0,442%

151.                     

называть

11

глагол

0,442%

152.                     

нога

11

существительное

0,442%

153.                     

передана

11

причастие

0,442%

154.                     

показать

11

глагол

0,442%

155.                     

после

11

наречие

0,442%

156.                     

прежде

11

наречие

0,442%

157.                     

при

11

предлог

0,442%

158.                     

себя

11

местоимение

0,442%

159.                     

хотя

11

союз

0,442%

160.                     

бедный

10

прилагательное

0,402%

161.                     

веселый

10

прилагательное

0,402%

162.                     

весь

10

местоимение

0,402%

163.                     

думать

10

глагол

0,402%

164.                     

люди

10

существительное

0,402%

165.                     

мысль

10

существительное

0,402%

166.                     

сквернохульничал

10

глагол

0,402%

167.                     

слышать

10

глагол

0,402%

168.                     

стол

10

существительное

0,402%

169.                     

точный

10

прилагательное

0,402%

170.                     

частный

10

прилагательное

0,402%

171.                     

будочник

9

существительное

0,362%

172.                     

впрочем

9

союз

0,362%

173.                     

голос

9

существительное

0,362%

174.                     

дверь

9

существительное

0,362%

175.                     

делать

9

глагол

0,362%

176.                     

добирался

9

глагол

0,362%

177.                     

дорога

9

существительное

0,362%

178.                     

жизнь

9

существительное

0,362%

179.                     

знает

9

глагол

0,362%

180.                     

капот

9

существительное

0,362%

181.                     

многие

9

прилагательное

0,362%

182.                     

начал

9

глагол

0,362%

183.                     

никак

9

наречие

0,362%

184.                     

образом

9

существительное

0,362%

185.                     

оно

9

местоимение

0,362%

186.                     

под

9

предлог

0,362%

187.                     

потрепливая

9

деепричастие

0,362%

188.                     

северный

9

прилагательное

0,362%

189.                     

случалось

9

глагол

0,362%

190.                     

снег

9

существительное

0,362%

191.                     

ты

9

местоимение

0,362%

192.                     

часть

9

существительное

0,362%

193.                     

чувствовать

9

глагол

0,362%

194.                     

шинелишке

9

существительное

0,362%

195.                     

эти

9

местоимение

0,362%

196.                     

глядеть

8

глагол

0,322%

197.                     

довольный

8

прилагательное

0,322%

198.                     

дух

8

существительное

0,322%

199.                     

есть

8

глагол

0,322%

200.                     

женился

8

глагол

0,322%

201.                     

значительный

8

прилагательное

0,322%

202.                     

им

8

местоимение

0,322%

203.                     

кое

8

местоимение

0,322%

204.                     

лестница

8

существительное

0,322%

205.                     

много

8

наречие

0,322%

206.                     

начальник

8

существительное

0,322%

207.                     

немцы

8

существительное

0,322%

208.                     

обратившее

8

прилагательное

0,322%

209.                     

обыкновенный

8

прилагательное

0,322%

210.                     

очнулся

8

глагол

0,322%

211.                     

первый

8

числительное

0,322%

212.                     

положение

8

существительное

0,322%

213.                     

приятель

8

существительное

0,322%

214.                     

работа

8

существительное

0,322%

215.                     

святой

8

прилагательное

0,322%

216.                     

теперь

8

наречие

0,322%

217.                     

три

8

числительное

0,322%

218.                     

тут

8

наречие

0,322%

219.                     

хозяйка

8

существительное

0,322%

220.                     

час

8

существительное

0,322%

221.                     

чепчик

8

существительное

0,322%

222.                     

вам

7

местоимение

0,282%

223.                     

вместо

7

предлог

0,282%

224.                     

войти

7

глагол

0,282%

225.                     

всего

7

местоимение

0,282%

226.                     

вскочила

7

глагол

0,282%

227.                     

до

7

предлог

0,282%

228.                     

должен

7

прилагательное

0,282%

229.                     

ежели

7

союз

0,282%

230.                     

имя

7

существительное

0,282%

231.                     

итак

7

союз

0,282%

232.                     

лет

7

существительное

0,282%

233.                     

ли

7

частица

0,282%

234.                     

неизвестно

7

наречие

0,282%

235.                     

нигде

7

наречие

0,282%

236.                     

подкладка

7

существительное

0,282%

237.                     

правую

7

прилагательное

0,282%

238.                     

согласилась

7

глагол

0,282%

239.                     

столоначальник

7

существительное

0,282%

240.                     

стоять

7

глагол

0,282%

241.                     

титул

7

существительное

0,282%

242.                     

титулярный

7

прилагательное

0,282%

243.                     

тотчас

7

наречие

0,282%

244.                     

узнать

7

глагол

0,282%

245.                     

чин

7

существительное

0,282%

246.                     

Бог

6

существительное

0,241%

247.                     

больной

6

прилагательное

0,241%

248.                     

будучи

6

деепричастие

0,241%

249.                     

ведь

6

союз

0,241%

250.                     

вечный

6

прилагательное

0,241%

251.                     

вицмундир

6

существительное

0,241%

252.                     

генерал

6

существительное

0,241%

253.                     

давать

6

глагол

0,241%

254.                     

давно

6

наречие

0,241%

255.                     

дать

6

глагол

0,241%

256.                     

другой

6

местоимение

0,241%

257.                     

известно

6

наречие

0,241%

258.                     

их

6

местоимение

0,241%

259.                     

казалось

6

глагол

0,241%

260.                     

канцелярия

6

существительное

0,241%

261.                     

квартира

6

существительное

0,241%

262.                     

крайней

6

прилагательное

0,241%

263.                     

мелькать

6

глагол

0,241%

264.                     

молодой

6

прилагательное

0,241%

265.                     

немалый

6

прилагательное

0,241%

266.                     

немного

6

наречие

0,241%

267.                     

нему

6

местоимение

0,241%

268.                     

никогда

6

наречие

0,241%

269.                     

ними

6

местоимение

0,241%

270.                     

онучек

6

существительное

0,241%

271.                     

остановить

6

глагол

0,241%

272.                     

откуда

6

наречие

0,241%

273.                     

панталон

6

существительное

0,241%

274.                     

перед

6

предлог

0,241%

275.                     

петербургский

6

прилагательное

0,241%

276.                     

площадь

6

существительное

0,241%

277.                     

подумал

6

глагол

0,241%

278.                     

пор

6

существительное

0,241%

279.                     

портной

6

существительное

0,241%

280.                     

разговор

6

существительное

0,241%

281.                     

сдернуть

6

глагол

0,241%

282.                     

следует

6

глагол

0,241%

283.                     

служил

6

глагол

0,241%

284.                     

случай

6

существительное

0,241%

285.                     

собственный

6

прилагательное

0,241%

286.                     

советник

6

существительное

0,241%

287.                     

сострадание

6

существительное

0,241%

288.                     

сумма

6

существительное

0,241%

289.                     

тепло

6

существительное

0,241%

290.                     

Трифилий

6

существительное

0,241%

291.                     

хоть

6

частица

0,241%

292.                     

черта

6

существительное

0,241%

293.                     

этой

6

местоимение

0,241%

294.                     

бледный

5

прилагательное

0,201%

295.                     

ваш

5

местоимение

0,201%

296.                     

враг

5

существительное

0,201%

297.                     

вся

5

местоимение

0,201%

298.                     

выражаться

5

глагол

0,201%

299.                     

голодать

5

глагол

0,201%

300.                     

гордец

5

существительное

0,201%

301.                     

давши

5

деепричастие

0,201%

302.                     

десять

5

числительное

0,201%

303.                     

добрый

5

прилагательное

0,201%

304.                     

долгое

5

прилагательное

0,201%

305.                     

должностной

5

прилагательное

0,201%

306.                     

желая

5

глагол

0,201%

307.                     

женщина

5

существительное

0,201%

308.                     

здесь

5

наречие

0,201%

309.                     

идет

5

глагол

0,201%

310.                     

ища

5

деепричастие

0,201%

311.                     

казалась

5

глагол

0,201%

312.                     

кошка

5

существительное

0,201%

313.                     

кричать

5

глагол

0,201%

314.                     

кулак

5

существительное

0,201%

315.                     

любовью

5

существительное

0,201%

316.                     

надлежащий

5

причастие

0,201%

317.                     

надобно

5

прилагательное

0,201%

318.                     

нарочно

5

прилагательное

0,201%

319.                     

нашелся

5

глагол

0,201%

320.                     

низенький

5

прилагательное

0,201%

321.                     

нос

5

существительное

0,201%

322.                     

нужна

5

прилагательное

0,201%

323.                     

общество

5

существительное

0,201%

324.                     

обычай

5

существительное

0,201%

325.                     

около

5

наречие

0,201%

326.                     

они

5

местоимение

0,201%

327.                     

отважные

5

прилагательное

0,201%

328.                     

отношение

5

существительное

0,201%

329.                     

помощник

5

существительное

0,201%

330.                     

понимаете

5

глагол

0,201%

331.                     

пора

5

существительное

0,201%

332.                     

почерком

5

существительное

0,201%

333.                     

почувствовал

5

глагол

0,201%

334.                     

пошатнулся

5

глагол

0,201%

335.                     

пришлась

5

глагол

0,201%

336.                     

произошел

5

глагол

0,201%

337.                     

просто

5

наречие

0,201%

338.                     

против

5

наречие

0,201%

339.                     

проходить

5

глагол

0,201%

340.                     

прямым

5

прилагательное

0,201%

341.                     

пусть

5

частица

0,201%

342.                     

пятьдесят

5

числительное

0,201%

343.                     

разве

5

частица

0,201%

344.                     

разный

5

прилагательное

0,201%

345.                     

расположении

5

существительное

0,201%

346.                     

решительные

5

прилагательное

0,201%

347.                     

род

5

существительное

0,201%

348.                     

русский

5

прилагательное

0,201%

349.                     

свет

5

существительное

0,201%

350.                     

сердце

5

существительное

0,201%

351.                     

сквозило

5

глагол

0,201%

352.                     

сколько

5

наречие

0,201%

353.                     

сконфузился

5

глагол

0,201%

354.                     

скоро

5

наречие

0,201%

355.                     

смотреть

5

глагол

0,201%

356.                     

со

5

предлог

0,201%

357.                     

сословий

5

существительное

0,201%

358.                     

спросить

5

глагол

0,201%

359.                     

старуха

5

существительное

0,201%

360.                     

старым

5

прилагательное

0,201%

361.                     

страшно

5

наречие

0,201%

362.                     

строгость

5

существительное

0,201%

363.                     

сукно

5

существительное

0,201%

364.                     

торжественнейший

5

прилагательное

0,201%

365.                     

улыбался

5

глагол

0,201%

366.                     

хотел

5

глагол

0,201%

367.                     

чрез

5

предлог

0,201%

368.                     

явиться

5

глагол

0,201%

 

 

Выводы:

Для начала хотелось бы проанализировать основные положения Закона Ципфа.

и

426

в

258

не

207

он

181

на

171

быть

157

что

124

как

111

какой

94

чтоб

93

 

Действительно, если разбить десять наиболее частотных слов на группы, видим, что частота второй группы примерно в два раза ниже самого частотного слова, частота третьей – в три раза ниже и т.д. Часто встречаемые слова в основном являются служебными частями речи и несут мало информации и специфике текста. Наиболее значимые слова находятся в средней части диаграммы.

 

Проанализировав кривую Ципфа, приходим к выводу об очень высоком количестве уникальных слов и, соответственно, об их низкой частотности. Что говорит нам об колоссальном словарном запасе автора, но, в то же время, помешает нам воссоздать суть произведения, исходя из выборки частотного минимума.

Наиболее характерными словами для составленного мной частотного словаря явились служебные слова: союзы, предлоги, частицы. Так, самое частотное слово– это союз «и», второе место принадлежит предлогу «в», замыкает тройку частица «не».

В частотном словаре современного русского языка наиболее частотными являются служебные слова: союзы, предлоги, частицы. Так, самое частотное слово русского языка – это союз «и», второе место принадлежит предлогу «в», замыкает тройку частица «не». Местоимения вторые по частотности использования в русском языке. В тройке лидеров: я, он, это.

В моём частотном словаре местоимение «он» сохранило свою позицию, но на второе место, также, поднялись предлог «на» и союз «что».

Среди существительных моего частотного словаря самыми частотными словами являются имена собственные, что совершенно логично, но не является характеризующей чертой самого произведения. Поэтому при анализе мы их учитывать не будем. Затем по частоте идёт «товарищ», во вторую группу можно было бы объединить слова «лицо», «чиновник», «человек», т.к. их частотность отличается на сотые доли процента. И замыкают тройку лидеров слова «дело», «слово», «год» и «день».

В частотном словаре современного русского языка наиболее частотными среди существительных являются слово – «год», затем идёт «человек», а на третьем месте «время».

Самое популярное прилагательное в произведении – «шинельный», второе место занимает в этом списке «самый», и на третьей ступеньке пьедестала – «новый».

Самое популярное прилагательное в русском языке – «новый», второе место занимает в этом списке «большой», и на третьей ступеньке пьедестала – «должен».

Частота употребления глаголов представлена в следующем порядке: разумеется, самый частотный глагол – это «быть», следом за ним идёт «садиться», замыкает тройку «мочь».

В частотном словаре современного русского языка наиболее частотными среди глаголов являются слово «быть», следом за ним идёт «мочь», замыкает тройку «сказать».

Сравнение частотного словаря повести Н.В.Гоголя с Частотным словарем современного русского языка (на материалах Национального корпуса русского языка) показало, что несмотря на специфический стиль произведения, несмотря на почти 180 лет, разделяющих нас с автором, самые частотные слова повести практически полностью совпадают с частотными словами современного русского языка. Это ещё раз доказывает универсальность, актуальность и репрезентативность частотных словарей.

II.    Анализ встречаемости частей речи

 

Слова, входящие в лексический минимум, относятся к следующим частям речи:

 

Часть речи

Количество

Доля (%)

существительное

1411

20,35%

союз

1164

16,79%

предлог

904

13,04%

местоимение

853

12,30%

глагол

834

12,03%

наречие

619

8,93%

частица

544

7,85%

прилагательное

410

5,91%

числительное

94

1,36%

деепрчастие

42

0,61%

причастие

33

0,48%

СЧР

26

0,37%

 

 

 

 

 

 

Частотный список имен существительных

Слово

Количество

Частота встречаемости в тексте

  1.  

Акакий

92

6,52%

  1.  

Акакиевич

90

6,38%

  1.  

товарищ

52

3,69%

  1.  

Петрович

51

3,61%

  1.  

лицо

37

2,62%

  1.  

чиновник

36

2,55%

  1.  

человек

35

2,48%

  1.  

дело

30

2,13%

  1.  

слово

30

2,13%

  1.  

день

28

1,98%

  1.  

руки

28

1,98%

  1.  

дом

27

1,91%

  1.  

желание

26

1,84%

  1.  

ужин

25

1,77%

  1.  

улица

23

1,63%

  1.  

время

21

1,49%

  1.  

департамент

21

1,49%

  1.  

избежание

19

1,35%

  1.  

раз

17

1,20%

  1.  

сам

17

1,20%

  1.  

шинель

17

1,20%

  1.  

глаз

16

1,13%

  1.  

комната

16

1,13%

  1.  

место

15

1,06%

  1.  

воротник

14

0,99%

  1.  

голова

14

0,99%

  1.  

мертвец

14

0,99%

  1.  

плечи

14

0,99%

  1.  

чубуков

13

0,92%

  1.  

бумага

12

0,85%

  1.  

вечер

12

0,85%

  1.  

вид

12

0,85%

  1.  

мере

12

0,85%

  1.  

могила

12

0,85%

  1.  

сторона

12

0,85%

  1.  

темнота

12

0,85%

  1.  

ужас

12

0,85%

  1.  

минута

11

0,78%

  1.  

нога

11

0,78%

  1.  

люди

10

0,71%

  1.  

мысль

10

0,71%

  1.  

стол

10

0,71%

  1.  

будочник

9

0,64%

  1.  

голос

9

0,64%

  1.  

дверь

9

0,64%

  1.  

дорога

9

0,64%

  1.  

жизнь

9

0,64%

  1.  

капот

9

0,64%

  1.  

образом

9

0,64%

  1.  

снег

9

0,64%

  1.  

часть

9

0,64%

  1.  

шинелишке

9

0,64%

  1.  

дух

8

0,57%

  1.  

лестница

8

0,57%

  1.  

начальник

8

0,57%

  1.  

немцы

8

0,57%

  1.  

положение

8

0,57%

  1.  

приятель

8

0,57%

  1.  

работа

8

0,57%

  1.  

хозяйка

8

0,57%

  1.  

час

8

0,57%

  1.  

чепчик

8

0,57%

  1.  

имя

7

0,50%

  1.  

лет

7

0,50%

  1.  

подкладка

7

0,50%

  1.  

столоначальник

7

0,50%

  1.  

титул

7

0,50%

  1.  

чин

7

0,50%

  1.  

Бог

6

0,43%

  1.  

вицмундир

6

0,43%

  1.  

генерал

6

0,43%

  1.  

канцелярия

6

0,43%

  1.  

квартира

6

0,43%

  1.  

онучек

6

0,43%

  1.  

панталон

6

0,43%

  1.  

площадь

6

0,43%

  1.  

пор

6

0,43%

  1.  

портной

6

0,43%

  1.  

разговор

6

0,43%

  1.  

случай

6

0,43%

  1.  

советник

6

0,43%

  1.  

сострадание

6

0,43%

  1.  

сумма

6

0,43%

  1.  

тепло

6

0,43%

  1.  

Трифилий

6

0,43%

  1.  

черта

6

0,43%

  1.  

враг

5

0,35%

  1.  

гордец

5

0,35%

  1.  

женщина

5

0,35%

  1.  

кошка

5

0,35%

  1.  

кулак

5

0,35%

  1.  

любовью

5

0,35%

  1.  

нос

5

0,35%

  1.  

общество

5

0,35%

  1.  

обычай

5

0,35%

  1.  

отношение

5

0,35%

  1.  

помощник

5

0,35%

  1.  

пора

5

0,35%

  1.  

почерком

5

0,35%

  1.  

расположении

5

0,35%

  1.  

род

5

0,35%

  1.  

свет

5

0,35%

  1.  

сердце

5

0,35%

  1.  

сословий

5

0,35%

  1.  

старуха

5

0,35%

  1.  

строгость

5

0,35%

  1.  

сукно

5

0,35%

 

 

Частотный список глаголов

Слово

Количество

Частота встречаемости в тексте

1.      

быть

157

18,82%

2.      

садился

45

5,40%

3.      

мог

41

4,92%

4.      

дайте

35

4,20%

5.      

сказать

35

4,20%

6.      

видеть

24

2,88%

7.      

сделать

23

2,76%

8.      

говорить

22

2,64%

9.      

будет

19

2,28%

10.  

стать

19

2,28%

11.  

вышел

14

1,68%

12.  

взять

13

1,56%

13.  

убивать

13

1,56%

14.  

выбежали

12

1,44%

15.  

знать

12

1,44%

16.  

пошел

12

1,44%

17.  

иметь

11

1,32%

18.  

называть

11

1,32%

19.  

показать

11

1,32%

20.  

думать

10

1,20%

21.  

сквернохульничал

10

1,20%

22.  

слышать

10

1,20%

23.  

делать

9

1,08%

24.  

добирался

9

1,08%

25.  

знает

9

1,08%

26.  

начал

9

1,08%

27.  

случалось

9

1,08%

28.  

чувствовать

9

1,08%

29.  

глядеть

8

0,96%

30.  

есть

8

0,96%

31.  

женился

8

0,96%

32.  

очнулся

8

0,96%

33.  

войти

7

0,84%

34.  

вскочила

7

0,84%

35.  

согласилась

7

0,84%

36.  

стоять

7

0,84%

37.  

узнать

7

0,84%

38.  

давать

6

0,72%

39.  

дать

6

0,72%

40.  

казалось

6

0,72%

41.  

мелькать

6

0,72%

42.  

остановить

6

0,72%

43.  

подумал

6

0,72%

44.  

сдернуть

6

0,72%

45.  

следует

6

0,72%

46.  

служил

6

0,72%

47.  

выражаться

5

0,60%

48.  

голодать

5

0,60%

49.  

желая

5

0,60%

50.  

идет

5

0,60%

51.  

казалась

5

0,60%

52.  

кричать

5

0,60%

53.  

нашелся

5

0,60%

54.  

понимаете

5

0,60%

55.  

почувствовал

5

0,60%

56.  

пошатнулся

5

0,60%

57.  

пришлась

5

0,60%

58.  

произошел

5

0,60%

59.  

проходить

5

0,60%

60.  

сквозило

5

0,60%

61.  

сконфузился

5

0,60%

62.  

смотреть

5

0,60%

63.  

спросить

5

0,60%

64.  

улыбался

5

0,60%

65.  

хотел

5

0,60%

66.  

явиться

5

0,60%

 

 

Частотный список имен прилагательных

Слово

Количество

Частота встречаемости в тексте

1.      

шинельный

45

10,976%

2.      

самый

39

9,512%

3.      

новый

33

8,049%

4.      

всякий

32

7,805%

5.      

сильный

13

3,171%

6.      

небольшой

12

2,927%

7.      

бедный

10

2,439%

8.      

веселый

10

2,439%

9.      

точный

10

2,439%

10.  

частный

10

2,439%

11.  

многие

9

2,195%

12.  

северный

9

2,195%

13.  

довольный

8

1,951%

14.  

значительный

8

1,951%

15.  

обратившее

8

1,951%

16.  

обыкновенный

8

1,951%

17.  

святой

8

1,951%

18.  

должен

7

1,707%

19.  

правую

7

1,707%

20.  

титулярный

7

1,707%

21.  

больной

6

1,463%

22.  

вечный

6

1,463%

23.  

крайней

6

1,463%

24.  

молодой

6

1,463%

25.  

немалый

6

1,463%

26.  

петербургский

6

1,463%

27.  

собственный

6

1,463%

28.  

бледный

5

1,220%

29.  

добрый

5

1,220%

30.  

долгое

5

1,220%

31.  

должностной

5

1,220%

32.  

надобно

5

1,220%

33.  

нарочно

5

1,220%

34.  

низенький

5

1,220%

35.  

нужна

5

1,220%

36.  

отважные

5

1,220%

37.  

прямым

5

1,220%

38.  

разный

5

1,220%

39.  

решительные

5

1,220%

40.  

русский

5

1,220%

41.  

старым

5

1,220%

42.  

торжественнейший

5

1,220%

 

 

 

Выводы:

По причине очень большого количества уникальных слов в произведении и, соответственно их низкой частотности, очень тяжело наглядно проиллюстрировать, отражает ли лексический минимум публицистический смысл текста.

Поэтому я решила исключительно для наглядности попробовать извлечь «лексический минимум из лексического минимума».

Существительные

Глаголы

Прилагательные

Акакий

быть

шинельный

Акакиевич

садился

самый

товарищ

мог

новый

Петрович

дайте

всякий

лицо

сказать

сильный

чиновник

видеть

небольшой

человек

сделать

бедный

дело

говорить

веселый

слово

будет

точный

день

стать

частный

руки

вышел

 

дом

взять

 

желание

убивать

 

ужин

 

 

улица

 

 

время

 

 

департамент

 

 

избежание

 

 

раз

 

 

сам

 

 

шинель

 

 

 

  Вот такой вот составленный мной «лексический минимум лексического минимума» в общих чертах даёт нам некоторое представление о произведении. Можно догадаться, о каком произведении идёт речь.

 

Такие слова как чиновник, департамент характеризуют нам героя произведения; бедный, дело, дом, сам – его признак. Слова: желание, избежание, быть, человек, всякий характеризуют нам его состояние. Слова: новый, шинель, стать, новый, самый характеризуют нам его цель.

В составленном словаре учитывалось одновременно несколько частей речи: существительные, прилагательные и глаголы. Такое устройство словаря дает возможность расширить представление о художественном мире, т.к. позволяет увидеть и соотнести три стороны художественного мира: предмет, его признак и действие.

Искуственное уменьшение лексического минимума, предпринятое мной, может позволить, конечно, идентифицировать произведение, но совершенно не подходит для конкретной исследовательской задачи - изучения художественного мира поэта. По лексическому минимуму невозможно реконструировать основные параметры художественного мира автора.

Мне кажется, что можно попробовать

·        классифицировать слова по тематическим группам в соответствии с их контекстуальным значением;

·        рассмотреть возможность учитывать и межсловесные связи в рамках метафоры, тропов для понимания художественного мира как системы образов и мотивов, воплощенных в самостоятельных частях речи

 

Использование данных приёмов могло бы существенно уточнить, а может и изменить наши представления о творчестве Н.В.Гоголя.  Например, мне бы хотелось исследовать контексты применения прилагательного «весёлый» в данном произведении. Мне всегда казалось, что оно не характерно для стиля автора. Но, при объективном подсчёте оно обладает высокой частотностью.

При всей своей кажущейся «математичности» и «статистичности», настораживающей лингвистов, составление частотных словарей даёт нам массу возможностей, тем для размышления и объектов для исследования

Всё это позволяет нам говорить о продуктивности развития данного направления, хотя методика составления и интерпретации словаря требует дальнейшей разработок.

 

Просмотрено: 0%
Просмотрено: 0%
Скачать материал
Скачать материал "Отчёт по созданию и анализу частотного словаря повести Н.В.Гоголя "Шинель"."

Методические разработки к Вашему уроку:

Получите новую специальность за 3 месяца

Главный хранитель

Получите профессию

Фитнес-тренер

за 6 месяцев

Пройти курс

Рабочие листы
к вашим урокам

Скачать

Скачать материал

Найдите материал к любому уроку, указав свой предмет (категорию), класс, учебник и тему:

6 668 206 материалов в базе

Скачать материал

Другие материалы

Вам будут интересны эти курсы:

Оставьте свой комментарий

Авторизуйтесь, чтобы задавать вопросы.

  • Скачать материал
    • 26.01.2021 383
    • DOCX 982.5 кбайт
    • Оцените материал:
  • Настоящий материал опубликован пользователем Меркулова Людмила Викторовна. Инфоурок является информационным посредником и предоставляет пользователям возможность размещать на сайте методические материалы. Всю ответственность за опубликованные материалы, содержащиеся в них сведения, а также за соблюдение авторских прав несут пользователи, загрузившие материал на сайт

    Если Вы считаете, что материал нарушает авторские права либо по каким-то другим причинам должен быть удален с сайта, Вы можете оставить жалобу на материал.

    Удалить материал
  • Автор материала

    Меркулова Людмила Викторовна
    Меркулова Людмила Викторовна
    • На сайте: 5 лет и 3 месяца
    • Подписчики: 0
    • Всего просмотров: 50849
    • Всего материалов: 10

Ваша скидка на курсы

40%
Скидка для нового слушателя. Войдите на сайт, чтобы применить скидку к любому курсу
Курсы со скидкой

Курс профессиональной переподготовки

Копирайтер

Копирайтер

500/1000 ч.

Подать заявку О курсе

Курс повышения квалификации

Парикмахерское дело: организация и проведение мастер-классов и тренингов

36/72/108 ч.

от 1580 руб. от 940 руб.
Подать заявку О курсе

Курс профессиональной переподготовки

Организация деятельности специалиста-менеджера по платежным услугам

Менеджер по платежным услугам

600 ч.

9840 руб. 5600 руб.
Подать заявку О курсе

Курс повышения квалификации

Электромонтер по оперативным переключениям в распределительных сетях

72/144/180 ч.

от 1750 руб. от 1050 руб.
Подать заявку О курсе
  • Этот курс уже прошли 11 человек

Мини-курс

Организация и контроль занятий со студентами специальных медицинских групп

4 ч.

780 руб. 390 руб.
Подать заявку О курсе

Мини-курс

Стратегии B2C маркетинга: от анализа до взаимодействия с клиентом

8 ч.

1180 руб. 590 руб.
Подать заявку О курсе

Мини-курс

Маркетинг в сфере услуг: от управления до рекламы

4 ч.

780 руб. 390 руб.
Подать заявку О курсе
  • Сейчас обучается 30 человек из 14 регионов