Предыдущая статья
← Пишем бота для Telegram и хостим его на heroku

Пишем Telegram бота на вебхуках

25.03.2021 / 13:38 от aNNiMON

Java heroku, telegram, bot, webhook, вебхуки

Эта статья является дополнением к предыдущей «Пишем бота для Telegram и хостим его на heroku». Здесь я покажу, как сделать бота с поддержкой вебхуков на Heroku и с самоподписанным сертификатом на своём сервере. Расскажу о новых возможностях библиотеки tgbots-module, а также покажу пример встраивания двух ботов в один проект.

Содержание - tgbots-module
- 1. Базовая реализация бота
- 2. Добавляем систему команд
- 3. Команда на регулярных выражениях
- 4. Группа команд
- 5. config.yaml и профили
- 6a. Запуск на Heroku
- 6b. Запуск на своём сервере с самоподписанным сертификатом
- 7. Второй модуль бота

tgbots-module
tgbots-module основана на библиотеке TelegramBots и имеет ряд улучшений:

• Возможность вести разработку ботов в отдельных проектах, а затем собирать всех в одном исполняемом файле. Это позволяет работать над каждым ботом отдельно, заводить для них отдельные репозитории и т.д.
TelegramBots поддерживает регистрацию нескольких обработчиков для ботов в одном проекте, но для отключения бота приходится пересобирать проект. В tgbots-module для включения/отключения бота можно просто добавить или удалить строчку в конфиге, а затем перезапустить приложение.

• Возможность переключать способ получения обновлений с long polling на webhook и обратно без пересборки проекта. В TelegramBots для этого нужно менять базовый класс (TelegramLongPollingBot и TelegramWebHookBot), а затем пересобирать проект.

• Система команд с поддержкой ролей. Есть простые текстовые команды (/start, /help), команды с аргументами (/say hello), команды на регулярных выражениях (/donate (\d{1,3})) и команды для CallbackQuery и InlineQuery.

• Различные улучшения в API и полезные утилиты. Загрузчик yaml-конфигов, классы для локализации ботов, препроцессинг методов API. Есть возможность вызывать методы Telegram API из класса Methods. В таком случае появляются дополнительные полезные методы, которых нет в TelegramBots:

[копировать] [скачать]
Methods.sendMessage(chatId, text)
        .enableHtml()
        .inReplyTo(message)
        .callAsync(this);

Можно вызывать синхронный .call(this), а можно асинхронный .callAsync(this).

1. Базовая реализация бота
Чтобы было проще понять, на каком этапе что реализуется, я разбил создание двухмодульного бота на мелкие шаги. Начнём с создания простого бота. Можно смотреть коммит.

Создаём модуль бота и его обработчик:

[копировать] [скачать]
public class TestBot implements BotModule {
    public static void main(String[] args) {
        Runner.run(List.of(new TestBot()));
    }
 
    @Override
    public @NotNull BotHandler botHandler(@NotNull Config config) {
        return new TestBotHandler();
    }
}

[копировать] [скачать]
public class TestBotHandler extends BotHandler {
    private final TestBotConfig botConfig;
 
    public TestBotHandler() {
        final var configLoader = new YamlConfigLoaderService();
        botConfig = configLoader.loadResource("/testbot.yaml", TestBotConfig.class);
    }
 
    @Override
    protected BotApiMethod<?> onUpdate(@NotNull Update update) {
        final var msg = update.getMessage();
        if (msg != null && msg.hasText()) {
            System.out.println(msg.getChatId());
            Methods.sendMessage(msg.getChatId(), msg.getText().toUpperCase(Locale.ROOT))
                    .callAsync(this);
        }
        return null;
    }
 
    @Override
    public String getBotUsername() {
        return botConfig.getName();
    }
 
    @Override
    public String getBotToken() {
        return botConfig.getToken();
    }
}

Токен и юзернейм бота будут браться из yaml конфига testbot.yaml:

name: yoursuperbot
token: env(TOKEN)

И помещаться в объект:

[копировать] [скачать]
@JsonIgnoreProperties(ignoreUnknown = true)
public class TestBotConfig {
    private String name;
    private String token;
    // getters, setters
}

В конфиге строчка env(TOKEN) говорит о том, что значение следует взять из переменной окружения. Это в дальнейшем будет полезно при работе с Heroku. Чтобы поместить токен в переменную окружения, можно настроить Run configurations в идее:

Содержимое метода onUpdate должно быть уже вам знакомо по библиотеке TelegramBots: если в update приходит сообщение боту, в котором есть текст, то выводит id юзера в консоль и отправляем этот же текст в верхнем регистре юзеру.

Запускаем проект, пишем боту и получаем ответ:

2. Добавляем систему команд
Добавляем систему команд с простой текстовой командой /start:

[копировать] [скачать]
private final CommandRegistry<For> commands;
// ..
final var authority = new SimpleAuthority(this, botConfig.getAdminId());
commands = new CommandRegistry<>(this, authority);
commands.register(new SimpleCommand("/start", ctx -> {
    ctx.reply("Hi, " + ctx.user().getFirstName())
            .callAsync(ctx.sender);
}));

Система команд поддерживает разделение прав доступа. Можно задать команду, которая будет доступна только главному админу бота. По умолчанию команда доступна всем пользователям.

Чтобы реестр команд понимал кто есть кто, нужно реализовать интерфейс Authority или воспользоваться встроенным SimpleAuthority, которому нужно передать userId главного админа бота. Как обычно, чтобы не хардкодить, добавляем значение в конфиг:

name: yoursuperbot
token: env(TOKEN)
adminId: 1234

[копировать] [скачать]
public class TestBotConfig {
    private String name;
    private String token;
    private Long adminId;
    // getters, setters
}

Наконец, нужно добавить строку в onUpdate:

[копировать] [скачать]
@Override
protected BotApiMethod<?> onUpdate(@NotNull Update update) {
    if (commands.handleUpdate(update)) {
        return null;
    }
    // ...
}

Коммит со всеми изменениями на этом шаге.

3. Команда на регулярных выражениях
Обработчики простых команд удобно регистрировать лямбдой, а вот команды побольше лучше вынести в отдельный класс. Рассмотрим пример команды, которая распознаёт ссылку на YouTube:

[копировать] [скачать]
public class YouTubeThumbnail implements RegexCommand {
    @Override
    public Pattern pattern() {
        return Pattern.compile("https?://(?:www\\.)?youtu(?:\\.be/|be.com/watch\\?v=)([^#&?\\s]+)");
    }
 
    @SuppressWarnings("unchecked")
    @Override
    public EnumSet<For> authority() {
        return For.all();
    }
 
    @Override
    public void accept(@NotNull RegexMessageContext ctx) {
        var url = "https://img.youtube.com/vi/" + ctx.group(1) + "/hqdefault.jpg";
        ctx.replyWithPhoto()
                .setFile(new InputFile(url))
                .setCaption(url)
                .callAsync(ctx.sender);
    }
}

Для RegexCommand указываем регулярное выражение, роли и сам обработчик.

Чтобы зарегистрировать команду, нужно добавить одну строчку:

commands.register(new YouTubeThumbnail());

Коммит для этого шага.

4. Группа команд
Ещё одной полезной возможностью является вынесение команд в группу.
Например, есть простая текстовая команда /game, которая создаёт игру и отправляет сообщение с inline-клавиатурой. Также есть команда для обработки CallbackQuery этой игры. Почему бы не задать эти команды в одном классе?

[копировать] [скачать]
public class GuessNumberGame implements CommandBundle<For> {
    @Override
    public void register(@NotNull CommandRegistry<For> commands) {
        commands.register(new SimpleCommand("/game", this::startGame));
        commands.register(new SimpleCallbackQueryCommand("guess", this::checkGuess));
    }
 
    private void startGame(MessageContext ctx) {
        final var userId = ctx.chatId();
        // ...
    }
 
    private void checkGuess(CallbackQueryContext ctx) {
        final var userId = Long.parseLong(ctx.argument(0));
        final var guess = Integer.parseInt(ctx.argument(1));
        // ..
    }
}

callback data для inline-кнопки выглядит так:

guess:12345 7

Где, guess это команда, распознаваемая системой команд, а всё остальное — аргументы. Они разделяются пробелом и их можно достать по порядковому номеру через ctx.argument(..)

Регистрируем набор команд:

commands.registerBundle(new GuessNumberGame());

Коммит с изменениями.

5. config.yaml и профили
В config.yaml задаются настройки вебхуков, а также перечисляются модули ботов:

[копировать] [скачать]
log-level: INFO
webhook:
  enabled: false
  externalUrl: env(URL)
modules:
 - com.example.bot.TestBot

Именно здесь можно переключать long polling и webhook, а также отключать ботов.
Конфиг можно размещать как файл, либо как ресурс внутри приложения (удобно, если бот запускается на Heroku).
При этом, конфиг не является обязательным. По умолчанию используется long polling, а модулем становится тот, который указан в main:

Runner.run(List.of(new TestBot()));

Также есть поддержка профилей. Профиль по умолчанию использует config.yaml, но если задать профиль test или prod, то использоваться будут config-test.yaml или config-prod.yaml соответственно.
Чтобы указать профиль, необходимо передать его первым аргументом в Runner. Я делаю это из командной строки:

[копировать] [скачать]
public static void main(String[] args) {
    final var profile = args.length >= 1 ? args[0] : "";
    Runner.run(profile, List.of(new TestBot()));
}

java -jar bots.jar test
java -jar bots.jar prod

Всё это позволяет запускать одного бота на лонг поллинге при разработке, и всех ботов на вебхуках уже в продакшене.

Коммит для этого шага.

6a. Запуск на Heroku
Добавляем Procfile:

web: java -jar build/libs/tgbotsmodule-webhook-bot-1.0-SNAPSHOT-all.jar

Так как используется Java 11, указываем это в system.properties:

java.runtime.version=11

Также добавляем gradle таск stage в build.gradle:

task stage(dependsOn: ['clean', 'shadowJar'])

Иначе Heroku не сможет собрать приложение.

Не забываем добавить файл config.yaml:

[копировать] [скачать]
log-level: INFO
webhook:
  enabled: true
  port: env(PORT:8443)
  externalUrl: env(URL)
  internalUrl: http://0.0.0.0:$port
modules:
 - com.example.bot.TestBot

Heroku запускает веб-приложение каждый раз на разном порту, заранее узнать и записать значение порта нельзя. Но поскольку номер порта помещается в переменную окружения PORT, можно указать env(PORT) в конфиге.
То же самое проделываем с URL, чтобы не коммитить новый адрес при смене приложения в Heroku.

Создаём приложение в Heroku, добавляем в Config Vars токен от бота и адрес приложения:

Деплоим бота из гитхаба или из Heroku Git и радуемся работающему на вебхуках боту.

В отличие от лонг поллинга, который держит приложение всегда активным и, тем самым отъедая бесплатную квоту, бот на вебхуках может засыпать при длительном бездействии, что экономит дино-часы. Пробуждение составляет порядка 10-15 секунд, это вполне терпимо для обычного бота, но совершенно не подходит для инлайн ботов, имейте в виду.

6b. Запуск на своём сервере с самоподписанным сертификатом
Имеем: Debian или Ubuntu сервер, на котором порты 80 и 443 заняты основным сайтом, но хочется на нём запустить бота на вебхуках на порту 8443, который, благо, поддерживается телеграмом.

Допустим, IP-адрес сервера 123.45.67.89, находится он в Москве.

1. Создаём сертификат при помощи openssl
certgen.sh

[копировать] [скачать]
JKS=keystore.jks
CERT=public_cert.pem
 
openssl req -newkey rsa:2048 -sha256 -nodes \
    -keyout private.key -x509 \
    -days 365 \
    -out $CERT \
    -subj "/C=RU/ST=Moscow/L=Moscow/O=Organization/CN=123.45.67.89"
 
openssl pkcs12 -export \
    -in $CERT \
    -inkey private.key \
    -certfile $CERT \
    -out keystore.p12
 
keytool -importkeystore \
    -srckeystore keystore.p12 \
    -srcstoretype pkcs12 \
    -sigalg SHA1withRSA \
    -destkeystore $JKS \
    -deststoretype pkcs12
 
rm keystore.p12 private.key

Изменяем IP адрес и информацию о локации сервера на этой строчке:

-subj "/C=RU/ST=Moscow/L=Moscow/O=Organization/CN=123.45.67.89"

Запускаем скрипт, придумываем и вводим несколько раз пароль от сертификата, получаем в итоге два файла: keystore.jks и public_cert.pem.

2. Настраиваем вебхуки в config.yaml

[копировать] [скачать]
webhook:
  enabled: true
  port: 8443
  externalUrl: https://123.45.67.89:$port
  internalUrl: http://0.0.0.0:$port
  keystorePath: cert/keystore.jks
  keystorePassword: env(KEYSTORE_PASSWORD)
  certificatePublicKeyPath: cert/public_cert.pem

3. Запускаем приложение со всеми необходимыми переменными окружения

[копировать] [скачать]
KEYSTORE_PASSWORD=mysupersecretpasswordis123456 TOKEN=12345:ABCDEFG && java -jar tgbotsmodule-webhook-bot-all.jar

7. Второй модуль бота
Если вы планируете запускать бота на собственном сервере, а не на Heroku, тогда можно создать Gradle Multiproject в котором подпроектами будут отдельные модули бота:

[копировать] [скачать]
bots/
  gradle/
  testbot/
    .git/
    src/
    build.gradle
  secondbot/
    .git/
    src/
    build.gradle
  build.gradle
  settings.gradle

При этом остаётся возможность держать отдельные модули в отдельных репозиториях, запускать их по отдельности при отладке и собирать все модули в один jar при сборке.

Но Heroku требует лишь один репозиторий. И чтобы подключить второй репозиторий как зависимость для первого и основного, мы воспользуемся JitPack.

Создаём отдельный проект со вторым ботом (можно сразу смотреть весь репозиторий tgbotsmodule-bot2).

В build.gradle должны присутствовать как минимум эти три плагина:

plugins {
    id 'java-library'
    id 'application'
    id 'maven'
}

Первый позволит точнее указывать зависимости (api, implementation), второй позводит запускать приложение для отладки, а третий подготовит нужные файлы для релиза.

Так как используется Java 11, создаём файл jitpack.yml:

jdk:
  - openjdk11
install:
  - ./gradlew clean build install

Создаём конфиг для второго бота secondbot.yaml:

username: secondbot
token: env(BOT2_TOKEN)

Не забываем о возможном конфликте переменных окружения, токен для второго бота должен задаваться в другой переменной, нежели токен для первого.

config.yaml у второго ботмодуля в этот раз уже не понадобится, он будет у главного приложения.

В главном приложении в build.gradle добавляем новый репозиторий maven и зависимость:

[копировать] [скачать]
repositories {
    mavenCentral()
    maven { url "https://jitpack.io" }
}
 
dependencies {
    // ...
    implementation 'com.github.annimon-tutorials:tgbotsmodule-bot2:e0a072b0f3'
}

Правильно подключить зависимость поможет главная страница https://jitpack.io/
Вставляем адрес репозитория и нажимаем Look up, а напротив нужного коммита кнопку Get it:

Ниже появятся инструкции для подключения зависимости в проект.

В config.yaml главного приложения добавляем ещё один модуль:

[копировать] [скачать]
log-level: INFO
webhook:
  enabled: true
  port: env(PORT:8443)
  externalUrl: env(URL)
  internalUrl: http://0.0.0.0:$port
modules:
 - com.example.bot.TestBot
 - com.example.secondbot.SecondBot

Остаётся только запушить изменения на гитхаб, добавить в Heroku новую переменную окружения с токеном для второго бота и сделать Deploy.

Коммит с изменениями на этом шаге.

После успешного деплоя, оба бота будут работать на вебхуках в одном проекте.
Посмотреть в действии можно тут:
Первый бот: @tgbotsmodulebot (исходники)
Второй бот: @tgbotsmodule2bot (исходники)