Анализ резюме соискателей

📊 Интерактивные графики Plotly - можно масштабировать и наводить на точки для просмотра значений.

1. Распределение признака "Возраст"

Наиболее часто встречающийся возраст — 30 лет. Диапазон значений широк: от 14 до 100 лет. Возраст большинства соискателей (центральные 50% данных) находится в интервале от 27 до 36 лет. Аномалии лежат ниже ~10 и выше ~53 лет.

2. Распределение признака "Опыт работы (месяц)"

Модальное значение опыта работы — 81 месяц (~6.8 лет). Диапазон — от 1 до 1188 месяцев (99 лет). Опыт большинства соискателей лежит в интервале от 57 до 154 месяцев (~4.7-12.8 лет). Аномалии — выше ~300 месяцев (25 лет).

3. Распределение признака "ЗП (руб)"

Диапазон значений экстремально широк: от 1 рубля до 24,3 млн рублей. Зарплата большинства соискателей находится в интервале от 37 000 до 95 000 рублей. Аномалии лежат выше ~182 000 рублей. 5 соискателей требуют зарплату выше 1 млн рублей.

4. Зависимость медианной ЗП от уровня образования

Наибольшие медианные зарплатные ожидания у соискателей с высшим образованием, наименьшие — со средним. Признак уровня образования является существенно важным фактором при прогнозировании заработной платы.

5. Распределение ЗП в зависимости от города

Медианные ожидания выше всего в Москве и Санкт-Петербурге, ниже — в городах-миллионниках, минимальны — в остальных. Размахи похожи, но в столицах больше высоких выбросов. Признак города важен для прогнозирования ЗП.

6. Зависимость медианной ЗП от готовности к переезду и командировкам

Максимальную медианную ЗП (~66 тыс. руб.) имеют кандидаты, готовые и к переезду, и к командировкам. Минимальную (~40 тыс. руб.) — те, кто не готов ни к тому, ни к другому. Готовность к мобильности существенно повышает ожидания.

7. Зависимость медианной ЗП от возраста и образования (тепловая карта)

Внутри каждой образовательной группы с возрастом зарплатные ожидания растут. Наиболее высокие значения — у обладателей высшего образования в возрасте 30-40 лет. Образование остается решающим фактором во всех возрастах.

8. Зависимость опыта работы от возраста (диаграмма рассеяния)

Наблюдается ожидаемая положительная зависимость: с ростом возраста увеличивается опыт. 7 точек лежат выше линии "опыт = возраст" и являются аномалиями (опыт работы превышает или равен возрасту соискателя).

📈 Дополнительные визуализации (PNG)

Образование и пол

Мужчины-соискатели существенно преобладают в большинстве образовательных категорий, особенно среди обладателей среднего и неоконченного высшего образования.

Образование и пол

Тепловая карта распределения по полу и образованию

Логарифмический возраст

Распределение логарифма возраста асимметрично влево, что подтверждает правую асимметрию исходного распределения, вызванную наличием соискателей старшего возраста.

Логарифмический возраст

Распределение логарифмированного возраста