Потоки, конвейеры и перенаправление [103.4]

Sergey_Sysadmin

Урок 13. Потоки, конвейеры и перенаправление [103.4]

Любая утилита в Linux - это коробка с тремя проводами: один на вход, два на выход. Понимание, куда эти провода воткнуты по умолчанию и как их перетыкать, превращает набор разрозненных команд в инструмент. Этот урок про то, как администратор собирает из мелких программ обработку логов, фильтрацию, ветвление вывода и пакетные операции - без единой строчки на скриптовом языке, только средствами shell.

Как это работает

Когда ядро запускает процесс, оно открывает ему три файловых дескриптора. Дескриптор 0 - стандартный ввод (stdin), откуда программа читает. Дескриптор 1 - стандартный вывод (stdout), куда идет полезный результат. Дескриптор 2 - стандартный вывод ошибок (stderr), куда идут диагностика и предупреждения. По умолчанию все три привязаны к терминалу, поэтому ошибки и результат смешиваются на экране. Номера тут не случайность, а реальные числа в таблице открытых файлов процесса - именно поэтому в синтаксисе перенаправления мы пишем 2> и 1>&2.

Ключевая идея: stdout и stderr разделены намеренно. stdout несет данные, которые можно скормить дальше по конвейеру, а stderr несет сообщения для человека. Если бы они шли в один поток, любая ошибка попадала бы в данные и ломала следующую команду. Поэтому grep, find и прочие пишут результат в 1, а жалобы вроде "permission denied" в 2.

Перенаправление - это подмена того, куда указывает дескриптор, до запуска программы. Сам процесс этого не замечает: он как писал в дескриптор 1, так и пишет, просто за дескриптором теперь стоит файл, а не терминал. Конвейер (pipe) - это безымянный буфер в памяти ядра: stdout левой команды соединяется со stdin правой. Команды в конвейере запускаются параллельно, данные текут потоком, а не "сначала одна закончила, потом вторая начала".

Команды и примеры

Базовые перенаправления вывода. Один знак больше перезаписывает файл, два - дописывают в конец.

Код: Выделить всё

ls /etc > files.txt        # stdout в файл (перезапись)
date >> files.txt          # дописать в конец
sort < files.txt           # stdin из файла

Раздельная работа с потоками. Это сердце темы - отделить ошибки от данных.

Код: Выделить всё

find /etc -name '*.conf' > found.txt 2> errors.txt   # данные и ошибки в разные файлы
find /etc -name '*.conf' 2> /dev/null                # ошибки выбросить, оставить только результат
make 2>&1 | less                                     # объединить stderr со stdout и листать
make &> build.log                                    # и stdout, и stderr в один файл (bash)

Важна последовательность. Запись 2>&1 значит "дескриптор 2 теперь указывает туда же, куда сейчас указывает 1". Поэтому такой вариант НЕ сработает как ожидается:

Код: Выделить всё

command 2>&1 > file   # сначала 2 направили на терминал (туда, где был 1), потом 1 ушел в файл
command > file 2>&1   # правильно: сперва 1 в файл, потом 2 туда же, куда 1

Конвейеры и tee. Команда tee читает stdin и пишет одновременно в файл и в свой stdout - это тройник, ветвление потока.

Код: Выделить всё

dmesg | grep -i error | tee errors.log | wc -l   # и в файл, и счетчик на экран
echo 'net.ipv4.ip_forward=1' | sudo tee /etc/sysctl.d/99-fwd.conf   # запись в файл от root через sudo
journalctl -p err | tee -a audit.log              # -a дописать, не перезаписать

Запись через tee с sudo - классический прием: перенаправление > выполняется текущим shell без прав root, поэтому sudo command > /root/file падает с отказом, а sudo tee решает проблему, так как уже сам tee работает от root.

xargs строит команду из потока. Многие утилиты (rm, chmod, kill) принимают аргументы, а не stdin. xargs превращает строки ввода в аргументы.

Код: Выделить всё

find . -name '*.tmp' -print0 | xargs -0 rm -v        # -print0/-0 защита от пробелов в именах
echo 'a b c' | xargs -n1 echo                        # -n1 по одному аргументу на запуск
cat hosts.txt | xargs -I{} -P4 ping -c1 {}           # -I{} подстановка, -P4 четыре параллельно

here-document и here-string. here-doc подает блок текста на stdin, here-string - одну строку. Это замена временным файлам.

Код: Выделить всё

cat <<'EOF' > /etc/motd
Доступ только для своих.
Все действия пишутся в журнал.
EOF

bc <<< '3 * (4 + 5)'          # here-string: одна строка на stdin
grep root <<< "$(getent passwd)"

Кавычки у метки важны. Запись <<EOF подставляет переменные и $(...) внутри блока, а <<'EOF' (метка в кавычках) выдает текст буквально - удобно, когда в тексте есть знаки доллара или backslash, которые не надо трогать. Отступ табами съедает форма <<-EOF.

В Debian/Ubuntu и в RHEL/Fedora синтаксис shell одинаков (это bash), различий нет - перенаправление часть оболочки, а не дистрибутива.

Частые грабли

Порядок 2>&1 и > перепутан. Запомните правило: сначала направляем stdout в файл, потом stderr дублируем за ним - только > file 2>&1.
command > file читает И пишет в один файл (a > a) - shell обнуляет файл ДО запуска команды, данные теряются. Для in-place используйте sponge из пакета moreutils или временный файл.
echo text | sudo command > /root/f - перенаправление делает ваш shell без root, отказ в доступе. Решение - sudo tee.
xargs без -0 ломается на именах с пробелами и переводами строк. Связка find -print0 | xargs -0 обязательна для произвольных имен.
Пустой ввод все равно запускает команду один раз. Добавляйте xargs --no-run-if-empty (в GNU это поведение по умолчанию у -r), иначе rm без аргументов может удалить не то.
&> и >& - синтаксис bash, в POSIX sh их нет. В скриптах с #!/bin/sh пишите > file 2>&1.
Конвейер прячет код возврата. Статус всего pipe - это статус ПОСЛЕДНЕЙ команды. Для проверки ошибок в середине нужен set -o pipefail.

Мини-лаба

Запустите find /etc -name '*.conf' и убедитесь, что ошибки доступа смешаны с результатом на экране.
Повторите, разделив потоки: результат в conf.txt, ошибки в err.txt. Проверьте оба файла.
Соберите конвейер: journalctl -p warning | grep -i fail | tee fails.log | wc -l. Сверьте число строк с содержимым файла.
Через sudo tee запишите строку в /etc/sysctl.d/99-lab.conf, затем убедитесь, что прямой sudo echo > туда падает с отказом.
Командой find /tmp -type f -print0 | xargs -0 -I{} ls -l {} выведите детали файлов, корректно обработав пробелы в именах.
Создайте here-doc с двумя строками текста в файл report.txt, один раз с подстановкой $(date), один раз с буквальной меткой 'EOF' - сравните результат.

Контрольные вопросы

Какие номера дескрипторов у stdin, stdout и stderr и почему stderr отделен от stdout?
Чем отличается результат command 2>&1 > log от command > log 2>&1 и почему?
Зачем нужен tee и как с его помощью записать файл, требующий прав root?
В каком случае обязательна связка find -print0 | xargs -0 и что произойдет без нее?
Чем here-document отличается от here-string и что меняет кавычки вокруг метки (<<EOF против <<'EOF')?
Почему конвейер a | b может вернуть код успеха, даже если a завершилась с ошибкой, и как это исправить?

idleheap · Сообщение **idleheap** » 26 май 2026, 15:47

А зачем вообще 2>/dev/null, если можно просто глазами пропустить ошибки? Понял на find по /etc - там столько permission denied, что реальный результат тонет. Теперь всегда отделяю.

bdover · Сообщение **bdover** » 28 май 2026, 10:50

Споткнулся на sudo echo foo > /etc/файл - отказ в доступе, хотя я под sudo. Дошло, что перенаправление делает мой шелл, а не команда. tee спас.

Потоки, конвейеры и перенаправление [103.4]

Потоки, конвейеры и перенаправление [103.4]

Re: Потоки, конвейеры и перенаправление [103.4]

Re: Потоки, конвейеры и перенаправление [103.4]

Кто сейчас на конференции