youtubesummarizer/main.py

import os
from openai import OpenAI
from pytube import YouTube

def download_audio(video_url, output_filename='audio.mp4'):
    try:
        print("Starting audio download.")
        yt = YouTube(video_url)
        audio_stream = yt.streams.get_audio_only()
        audio_filename = audio_stream.download(filename=output_filename)
        print(f"Downloaded '{yt.title}' audio to {audio_filename}")
        return audio_filename
    except Exception as e:
        print(f"Failed to download audio: {e}")
        return None

def transcription(OPENAI_API_KEY, audio_filename):
    try:
        print("Transcription started.")

        client = OpenAI(api_key=OPENAI_API_KEY)
        audio_file = open(audio_filename, "rb")

        transcript = client.audio.transcriptions.create(
        file=audio_file,
        model="whisper-1",
        )

        print("Transcription finished.")

        return transcript
    except Exception as e:
        print(f"Failed to transcript audio: {e}")
        return None

def summarize(OPENAI_API_KEY, transcript):
    try:
        print("Summarizing starting")
        client = OpenAI(api_key=OPENAI_API_KEY)
        stream = client.chat.completions.create(
            model="gpt-4",
            messages=[
                {"role": "system", "content": "The prompt you will receive will be the transcript of a youtube video, your objective is to summarize the content of that transcript to the best of your ability, keep in mind there may be music or other parasit noises in the transcript."},
                {"role": "user", "content": str(transcript)}
                ],
            stream=True,
        )

        for chunk in stream:
            if chunk.choices[0].delta.content is not None:
                print(chunk.choices[0].delta.content, end="", flush=True)

        print("Summarizing finished")
    except Exception as e:
        print(f"Failed to summarize transcript: {e}")
        return None

def cleanup(audio_filename):
    try:
        print("Deleting audio file")
        os.remove(audio_filename)
        print(f"Deleted audio: {audio_filename}")
    except Exception as e:
        print(f"Failed to delete audio: {audio_filename}: {e}")
        return None

def main():
    OPENAI_API_KEY = os.environ.get('OPENAI_API_KEY')
    video_url = str(input("video url:"))
    audio_filename = download_audio(video_url)
    transcript = transcription(OPENAI_API_KEY, audio_filename)
    summarize(OPENAI_API_KEY, transcript)
    cleanup(audio_filename)

if __name__ == "__main__":
    main()