еще есть https://wit.ai и Yandex SpeechKit полностью бесрлатные. Первый распознает аудио до 50 сек, качество так себе, но много языков знает. Второй распознает получше, аудио больше 50 сек, но языков мало. Выбирать качество надо уже самому, потому что некоторые делают упор на разные особенности речи. Потестить Google Cloud Speech, wit.ai и Yandex SpeechKit можно в боте Telegram Voicy