Материалы и наборы файлов для практики из курса по вайбкодингу.
Нажмите зелёную кнопку Code → Download ZIP на странице репозитория и
распакуйте архив. Наборы лежат в папке documents/ — отдавайте агенту нужную.
Набор для урока про Claude Cowork. Пятнадцать PDF, которые имитируют реальный бардак в папке небольшого ИП за квартал: счета, чеки, договоры, банковские выписки, акт и пара посторонних файлов (статья, инструкция к роутеру).
На чём строится разбор:
- имена файлов бессмысленные (
scan_001.pdf,IMG_20260228.pdf,Документ Microsoft Word.pdf), а даты и суть документа лежат внутри PDF; - есть два настоящих дубликата под разными именами
(
scan_001.pdfиДокумент_новый(1).pdf;чек.pdfичек копия.pdf); - есть похожий, но не дубликат: счёт за тот же хостинг, но за другой месяц
(
scan_004.pdf) — проверка на то, что агент сверяет содержимое, а не имена.
Набор для самостоятельной работы. Четыре выгрузки контактов из разных источников: запись на вебинар (CSV), выгрузка из старой CRM (XLSX), контакты с конференции (XLSX) и подписчики рассылки (CSV).
Источники намеренно разнородные:
- разные названия колонок (
Имя/ФИО/Контакт;Email/Почта/e-mail); - разные форматы телефона (
+7 (912)…,89123…,8 912 345…,7912…); - разный формат имени (Имя Фамилия / Фамилия Имя Отчество / только имя);
- один и тот же человек встречается в нескольких источниках, иногда email
отличается только регистром (
A.Petrova@Gmail.comпротивa.petrova@gmail.com); - внутри файла бывает повтор и пустые поля, а в XLSX с конференции над таблицей стоит лишняя строка-заголовок.
Задача: свести всё в одну таблицу единого формата, привести телефоны к общему виду, убрать дубли, проставить источник.
Скрипты, которыми сгенерированы наборы (generate_documents.py,
generate_contacts.py). Запускать их не нужно: готовые файлы уже лежат в
папках. Скрипты оставлены, чтобы набор можно было пересобрать или поправить
(Python, библиотеки fpdf2 и openpyxl).