docs: add Phase 12 - voice message playback
Documented new feature for playing voice messages directly from TUI with full playback controls and visual feedback. Documentation Changes: - ROADMAP.md: Added Phase 12 with 7 stages - Stage 1: Audio infrastructure (audio module, AudioPlayer, VoiceCache) - Stage 2: TDLib integration (VoiceNoteInfo, download_voice_note) - Stage 3: UI for playback (progress bar, status indicators, footer) - Stage 4: Hotkeys (play/pause, stop, seek, volume control) - Stage 5: Configuration and UX (AudioConfig, ticker updates) - Stage 6: Error handling and fallback (system player) - Stage 7: Additional improvements (prefetching, animations) - CONTEXT.md: Added PLANNED section for Phase 12 - Technical stack: rodio 0.17, TDLib downloadFile - Platforms: Linux (ALSA/PulseAudio), macOS (CoreAudio), Windows (WASAPI) - Architecture: src/audio/ module with 3 submodules - LRU cache (100 MB limit) - Async loading, ticker for progress updates - Configuration options in config.toml - Fallback to system players (mpv, ffplay) - HOTKEYS.md: Added new hotkeys - `Space` - play/pause (in voice message selection mode) - `s` / `ы` - stop playback - `←` / `→` - seek -5s/+5s (during playback) - `↑` / `↓` - volume +/-10% (during playback) - Added new "Voice Playback" section - Added new "Voice Playback Mode" section - PROJECT_STRUCTURE.md: Added audio/ module documentation - player.rs - AudioPlayer with rodio - cache.rs - VoiceCache for downloaded OGG files - state.rs - PlaybackState (status, position, duration, volume) - Updated dependencies section (rodio 0.17) - Updated App state with audio fields Technical Details: - rodio 0.17 Pure Rust audio library (cross-platform) - OGG Opus support (Telegram voice message format) - Visual progress bar: ▶ ████████░░░░░░ 0:08 / 0:15 - Status indicators: ▶ (playing), ⏸ (paused), ⏹ (stopped), ⏳ (loading) - Smart caching with size limits - Async non-blocking file download - Ticker for smooth progress updates (100ms) - Graceful fallback to system players New Configuration (config.toml): - enabled: bool - enable/disable audio playback - default_volume: f32 - volume (0.0 - 1.0) - seek_step_seconds: i32 - seek step in seconds (default 5) - autoplay: bool - autoplay on selection - cache_size_mb: usize - cache size limit in MB - show_waveform: bool - show waveform visualization - system_player_fallback: bool - use system player fallback - system_player: String - system player command (mpv, ffplay) Status: PLANNED (documentation complete, implementation pending) Co-Authored-By: Claude Sonnet 4.5 <noreply@anthropic.com>
This commit is contained in:
135
ROADMAP.md
135
ROADMAP.md
@@ -290,3 +290,138 @@
|
||||
- `v` / `м` - открыть изображение в полном размере (режим выбора)
|
||||
- `←` / `→` - навигация между изображениями (в режиме просмотра)
|
||||
- `Esc` - закрыть полноэкранный просмотр
|
||||
|
||||
## Фаза 12: Прослушивание голосовых сообщений [PLANNED]
|
||||
|
||||
### Этап 1: Инфраструктура аудио [TODO]
|
||||
- [ ] Модуль src/audio/
|
||||
- player.rs - AudioPlayer на rodio
|
||||
- cache.rs - VoiceCache для загруженных файлов
|
||||
- state.rs - PlaybackState (статус, позиция, громкость)
|
||||
- [ ] Зависимости
|
||||
- rodio 0.17 - Pure Rust аудио библиотека
|
||||
- Feature flag "audio" в Cargo.toml
|
||||
- [ ] AudioPlayer API
|
||||
- play() - воспроизведение файла
|
||||
- pause() / resume() - пауза/возобновление
|
||||
- stop() - остановка
|
||||
- seek() - перемотка
|
||||
- set_volume() - регулировка громкости
|
||||
- get_position() - текущая позиция
|
||||
- [ ] VoiceCache
|
||||
- Кэш загруженных OGG файлов в ~/.cache/tele-tui/voice/
|
||||
- LRU политика очистки
|
||||
- MAX_VOICE_CACHE_SIZE = 100 MB
|
||||
|
||||
### Этап 2: Интеграция с TDLib [TODO]
|
||||
- [ ] Обработка MessageContentVoiceNote
|
||||
- Добавить VoiceNoteInfo в MessageInfo
|
||||
- Извлечение file_id, duration, mime_type, waveform
|
||||
- Метка формата (OGG Opus обычно)
|
||||
- [ ] Загрузка файлов
|
||||
- Метод TdClient::download_voice_note(file_id)
|
||||
- Асинхронная загрузка через downloadFile API
|
||||
- Обработка состояний (pending/downloading/ready)
|
||||
- [ ] Кэширование
|
||||
- Сохранение путей к загруженным файлам
|
||||
- Не перезагружать уже скачанные голосовые
|
||||
- Проверка существования файла перед воспроизведением
|
||||
|
||||
### Этап 3: UI для воспроизведения [TODO]
|
||||
- [ ] Индикатор в сообщении
|
||||
- Иконка 🎤 и длительность голосового
|
||||
- Progress bar во время воспроизведения
|
||||
- Статус: ▶ (playing), ⏸ (paused), ⏹ (stopped), ⏳ (loading)
|
||||
- Текущее время / общая длительность (0:08 / 0:15)
|
||||
- [ ] Модификация render_messages()
|
||||
- render_voice_note() для голосовых сообщений
|
||||
- render_progress_bar() для индикатора воспроизведения
|
||||
- Hint "[Space] Воспроизвести" если не играет
|
||||
- [ ] Footer с управлением
|
||||
- Отображение доступных команд при воспроизведении
|
||||
- "[Space] Play/Pause [s] Stop [←/→] Seek [↑/↓] Volume"
|
||||
- [ ] Waveform визуализация (опционально)
|
||||
- Конвертация waveform данных из Telegram в ASCII bars
|
||||
- Использование символов ▁▂▃▄▅▆▇█ для визуализации
|
||||
|
||||
### Этап 4: Хоткеи для управления [TODO]
|
||||
- [ ] Новые команды
|
||||
- PlayVoice - Space в режиме выбора голосового
|
||||
- PauseVoice - Space во время воспроизведения
|
||||
- StopVoice - s / ы
|
||||
- SeekBackward - ← (перемотка назад на 5 сек)
|
||||
- SeekForward - → (перемотка вперед на 5 сек)
|
||||
- VolumeUp - ↑ (увеличить на 10%)
|
||||
- VolumeDown - ↓ (уменьшить на 10%)
|
||||
- [ ] Контекстная обработка
|
||||
- Space работает как play/pause в зависимости от состояния
|
||||
- ← / → для seek только во время воспроизведения
|
||||
- ↑ / ↓ для громкости только во время воспроизведения
|
||||
- [ ] Поддержка русской раскладки
|
||||
- s / ы - stop
|
||||
- Остальные клавиши универсальны (Space, стрелки)
|
||||
|
||||
### Этап 5: Конфигурация и UX [TODO]
|
||||
- [ ] AudioConfig в config.toml
|
||||
- enabled: bool - включить/отключить аудио
|
||||
- default_volume: f32 - громкость по умолчанию (0.0 - 1.0)
|
||||
- seek_step_seconds: i32 - шаг перемотки в секундах
|
||||
- autoplay: bool - автовоспроизведение при выборе
|
||||
- cache_size_mb: usize - размер кэша голосовых
|
||||
- show_waveform: bool - показывать waveform визуализацию
|
||||
- system_player_fallback: bool - использовать системный плеер
|
||||
- system_player: String - команда системного плеера (mpv, ffplay)
|
||||
- [ ] Асинхронная загрузка
|
||||
- Не блокировать UI во время загрузки файла
|
||||
- Индикатор загрузки с процентами
|
||||
- Возможность отмены загрузки
|
||||
- [ ] Обновление UI
|
||||
- Ticker для обновления progress bar (каждые 100ms)
|
||||
- Плавное обновление позиции воспроизведения
|
||||
- Автоматическая остановка при достижении конца
|
||||
|
||||
### Этап 6: Обработка ошибок [TODO]
|
||||
- [ ] Graceful fallback на системный плеер
|
||||
- Если rodio не работает - использовать mpv/ffplay
|
||||
- Логирование ошибок через tracing
|
||||
- Предупреждение пользователю если аудио недоступно
|
||||
- [ ] Обработка ошибок загрузки
|
||||
- Таймаут загрузки (30 сек)
|
||||
- Повторная попытка по запросу
|
||||
- Сообщение об ошибке в UI
|
||||
- [ ] Ограничения
|
||||
- Максимальный размер файла для кэша
|
||||
- Автоматическая очистка старых файлов
|
||||
- Предупреждение для очень длинных голосовых (>5 мин)
|
||||
|
||||
### Этап 7: Дополнительные улучшения [TODO]
|
||||
- [ ] Управление воспроизведением
|
||||
- Автоматическая остановка при закрытии чата
|
||||
- Сохранение позиции при паузе
|
||||
- Автопереход к следующему голосовому (опционально)
|
||||
- [ ] Оптимизация
|
||||
- Lazy loading (загрузка только при воспроизведении)
|
||||
- Префетчинг следующего голосового (опционально)
|
||||
- Минимальная задержка при нажатии Play
|
||||
- [ ] Визуальные улучшения
|
||||
- Анимация progress bar
|
||||
- Цветовая индикация статуса (зеленый - playing, желтый - paused)
|
||||
- Иконки в зависимости от статуса
|
||||
|
||||
### Технические детали
|
||||
- **Аудио библиотека:**
|
||||
- rodio 0.17 (Pure Rust, кроссплатформенная)
|
||||
- Поддержка OGG Opus (формат голосовых в Telegram)
|
||||
- Контроль воспроизведения через Sink API
|
||||
- **Платформы:**
|
||||
- Linux (ALSA, PulseAudio)
|
||||
- macOS (CoreAudio)
|
||||
- Windows (WASAPI)
|
||||
- **Fallback:**
|
||||
- mpv --no-video (универсальный плеер)
|
||||
- ffplay -nodisp (из ffmpeg)
|
||||
- **Новые хоткеи:**
|
||||
- `Space` - воспроизвести/пауза (в режиме выбора голосового)
|
||||
- `s` / `ы` - остановить воспроизведение
|
||||
- `←` / `→` - перемотка -5с / +5с (во время воспроизведения)
|
||||
- `↑` / `↓` - громкость +/- 10% (во время воспроизведения)
|
||||
|
||||
Reference in New Issue
Block a user