TakwayBoard/ws_client.py

from takway.clients.web_socket_client_utils import WebSocketClinet
import pvporcupine
import pyaudio
import platform


if __name__ == '__main__':
    
    # server_url = 'ws://121.41.224.27:8000/chat'
    # server_url = 'ws://39.107.254.69:33089/chat'
    # server_url = 'wss://takway-ai.kingtous.cn/chat/streaming'
    # server_url = 'ws://114.214.236.207:7878/chat/streaming'
    server_url = 'wss://takway-ai.top:8001/chat/streaming/temporary'
    
    # session_id = 'b5923335-a0dd-4d50-b3bf-5ce2a50894ed'
    # session_id = '28445e6d-e8c1-46a6-b980-fbf39b918def' # 鸭
    # session_id = '6e4e7404-c4db-45ac-ba88-b0a483556f66' # 睡 v2
    session_id = '469f4a99-12a5-45a6-bc91-353df07423b6' # 新
    # session_id = '2eaaeb9b-a40b-49cc-a0f8-390f9204c723' # 新2, 机器人声音
    
    
    excute_args = {}
    # excute_args = {'enable': True}
    
    ACCESS_KEY = 'hqNqw85hkJRXVjEevwpkreB8n8so3w9JPQ27qnCR5qTH8a3+XnkZTA=='
    
    system = platform.system()
    if system == 'Windows':
        print("WebSocketClinet runs on Windows system.")
        board = None
    elif system == 'Linux':
        # board = 'v329'
        board = 'orangepi'
        ACCESS_KEY = 'GPFKn+Z9LHGh8yZNfWkLUYRixnrsyY+5w8KN3rpl6sw+Bi7XIqbgTw=='
    
    mircophone_device = None
    speaker_device = None
    
    
    if board == 'v329':
        import gpiod as gpio
        
        keywords = ['hey google', 'ok google']
        keyword_paths = None
        model_path = None
        
        keywords = ['可莉可莉']
        keyword_paths = [r"picovoice_models/可莉可莉_zh_raspberry-pi_v3_0_0.ppn"]
        model_path = r"picovoice_models/porcupine_params_zh.pv"
        
        hd_trigger = 'button'
        player = 'maixsense'
    elif board == 'orangepi':
        
        keywords = ['hey google', 'ok google', '芭比']
        keyword_paths = None
        model_path = None
        keyword_paths = ["models/芭比_zh_raspberry-pi_v3_0_0/芭比_zh_raspberry-pi_v3_0_0.ppn"]
        model_path = "models/porcupine_params_zh.pv"
        
        hd_trigger = 'button'
        
        mircophone_device = 2
        speaker_device = 2
        
    else:

        keywords = ['hey google', 'ok google']
        keyword_paths = None
        model_path = None
        
        
        hd_trigger = 'keyboard'
        player = 'opencv'
        
    
    import argparse
    parser = argparse.ArgumentParser()
    # server params
    
    
    # recorder paramters
    parser.add_argument('--voice_trigger', type=bool, default=True, help='Voice trigger')
    parser.add_argument('--access_key',default=ACCESS_KEY,
        help='AccessKey obtained from Picovoice Console (https://console.picovoice.ai/)')
    parser.add_argument('--keywords',nargs='+',choices=sorted(pvporcupine.KEYWORDS),type=list,
        default=keywords,
        help='List of default keywords for detection. Available keywords: %s' % ', '.join(
        '%s' % w for w in sorted(pvporcupine.KEYWORDS)),metavar='')
    parser.add_argument('--keyword_paths',nargs='+',
        default=keyword_paths,
        help="Absolute paths to keyword model files. If not set it will be populated from `--keywords` argument")
    parser.add_argument('--library_path',default=None,
        help='Absolute path to dynamic library. Default: using the library provided by `pvporcupine`')
    parser.add_argument('--model_path',
        default=model_path,
        help='Absolute path to the file containing model parameters. '
             'Default: using the library provided by `pvporcupine`')
    parser.add_argument('--sensitivities',type=float,
        default=0.9,
        help="Sensitivities for detecting keywords. Each value should be a number within [0, 1]. A higher "
             "sensitivity results in fewer misses at the cost of increasing the false alarm rate. If not set 0.5 "
             "will be used.")
    parser.add_argument('--hd_trigger', type=str, 
                        # default='keyboard', 
                        default=hd_trigger, 
                        help='Hardware trigger')
    parser.add_argument('--keyboard_key', type=str, default='space', help='Keyboard key')
    
    # recorder paramters
    parser.add_argument('--IN_CHUNK', type=int, default=3840, help='Record chunk size')    # 原来的
    parser.add_argument('--IN_RATE', type=int, default=16000, help='Audio rate')
    parser.add_argument('--IN_FORMAT', type=int, default=16, help='Audio format')
    parser.add_argument('--IN_CHANNELS', type=int, default=1, help='Audio channels')
    parser.add_argument('--IN_filename', type=str, default=None, help='Audio file name')
    parser.add_argument('--IN_frames_per_buffer', type=int, default=512, help='Frames per buffer')
    parser.add_argument('--min_stream_record_time', type=float, default=0.5, help='Min stream record time, sec')
    parser.add_argument('--max_slience_time', type=int, default=10, help='Max slient time when recording, sec')
    parser.add_argument('--min_act_time', type=float, default=0.6, help='Min inactive time, sec')   # 等待多少秒沉默就发送音频
    parser.add_argument('--mircophone_device', type=int, default=mircophone_device, help='Microphone device index')
    
    # player paramters
    parser.add_argument('--speaker_device', type=int, default=speaker_device, help='Speaker device index')
    parser.add_argument('--OUT_CHUNK', type=int, default=1024, help='Player chunk size')
    parser.add_argument('--OUT_RATE', type=int, default=22050, help='Player audio rate')
    parser.add_argument('--OUT_FORMAT', type=int, default=16, help='Player audio format')
    parser.add_argument('--OUT_CHANNELS', type=int, default=1, help='Player audio channels')
    parser.add_argument('--OUT_filename', type=str, default=None, help='Player audio file name')
    parser.add_argument('--OUT_frames_per_buffer', type=int, default=11025, help='Player frames per buffer')
    
    # log paramters
    parser.add_argument('--log_file', type=str, default='ws_client.log', help='Log file')
    parser.add_argument('--log_level', type=str, default='INFO', help='Log level')
    
    parser.add_argument('--debug', type=bool, default=False, help='Debug mode')
    args = parser.parse_args()
    
    # sort out args and params
    server_args = {
       'server_url': server_url,
       'session_id': session_id,
    }
    
    recorder_args = {
        'board': board,
        'access_key': args.access_key,
        'keywords': args.keywords,
        'keyword_paths': args.keyword_paths,
        'library_path': args.library_path,
        'model_path': args.model_path,
        'sensitivities': args.sensitivities,
        'hd_trigger': args.hd_trigger,
        'keyboard_key': args.keyboard_key,
        'voice_trigger': args.voice_trigger,
        'CHUNK': args.IN_CHUNK,
        'FORMAT': pyaudio.paInt16 if args.IN_FORMAT == 16 else pyaudio.paInt32,
        'CHANNELS': args.IN_CHANNELS,
        'RATE': args.IN_RATE,
        'min_act_time': args.min_act_time,
        'max_slience_time': args.max_slience_time,
        'min_stream_record_time': args.min_stream_record_time,
        'input_device_index': args.mircophone_device,
        'frames_per_buffer': args.IN_frames_per_buffer,
    }
    
    player_args = {
        'output_device_index': args.speaker_device,
        'CHUNK': args.OUT_CHUNK,
        'FORMAT': pyaudio.paInt16 if args.OUT_FORMAT == 16 else pyaudio.paInt32,
        'CHANNELS': args.OUT_CHANNELS,
        'RATE': args.OUT_RATE,
        'filename': args.OUT_filename,
        'frames_per_buffer': args.OUT_frames_per_buffer,
    }
    
    log_args = {
        'log_file': args.log_file,
        'log_level': args.log_level,
    }
    
    
    localclient = WebSocketClinet(
        board=board, 
        server_args=server_args, 
        recorder_args=recorder_args, 
        player_args=player_args,
        excute_args=excute_args,
        log_args=log_args)
    localclient.process_init()
update 2024-05-23 01:27:51 +08:00			`from takway.clients.web_socket_client_utils import WebSocketClinet`
			`import pvporcupine`
			`import pyaudio`
			`import platform`


			`if __name__ == '__main__':`

			`# server_url = 'ws://121.41.224.27:8000/chat'`
			`# server_url = 'ws://39.107.254.69:33089/chat'`
			`# server_url = 'wss://takway-ai.kingtous.cn/chat/streaming'`
			`# server_url = 'ws://114.214.236.207:7878/chat/streaming'`
update wss 2024-05-28 23:37:26 +08:00			`server_url = 'wss://takway-ai.top:8001/chat/streaming/temporary'`
update 2024-05-23 01:27:51 +08:00
			`# session_id = 'b5923335-a0dd-4d50-b3bf-5ce2a50894ed'`
			`# session_id = '28445e6d-e8c1-46a6-b980-fbf39b918def' # 鸭`
			`# session_id = '6e4e7404-c4db-45ac-ba88-b0a483556f66' # 睡 v2`
新交互逻辑，长按/短按 2024-05-23 16:07:23 +08:00			`session_id = '469f4a99-12a5-45a6-bc91-353df07423b6' # 新`
[session] update robot session 2024-05-29 23:27:41 +08:00			`# session_id = '2eaaeb9b-a40b-49cc-a0f8-390f9204c723' # 新2, 机器人声音`
update 2024-05-23 01:27:51 +08:00

			`excute_args = {}`
			`# excute_args = {'enable': True}`

			`ACCESS_KEY = 'hqNqw85hkJRXVjEevwpkreB8n8so3w9JPQ27qnCR5qTH8a3+XnkZTA=='`

			`system = platform.system()`
			`if system == 'Windows':`
			`print("WebSocketClinet runs on Windows system.")`
			`board = None`
			`elif system == 'Linux':`
			`# board = 'v329'`
			`board = 'orangepi'`
			`ACCESS_KEY = 'GPFKn+Z9LHGh8yZNfWkLUYRixnrsyY+5w8KN3rpl6sw+Bi7XIqbgTw=='`

			`mircophone_device = None`
			`speaker_device = None`


			`if board == 'v329':`
			`import gpiod as gpio`

			`keywords = ['hey google', 'ok google']`
			`keyword_paths = None`
			`model_path = None`

			`keywords = ['可莉可莉']`
			`keyword_paths = [r"picovoice_models/可莉可莉_zh_raspberry-pi_v3_0_0.ppn"]`
			`model_path = r"picovoice_models/porcupine_params_zh.pv"`

			`hd_trigger = 'button'`
			`player = 'maixsense'`
			`elif board == 'orangepi':`

[bug] board 2024-05-23 22:05:07 +08:00			`keywords = ['hey google', 'ok google', '芭比']`
update 2024-05-23 01:27:51 +08:00			`keyword_paths = None`
			`model_path = None`
[bug] board 2024-05-23 22:05:07 +08:00			`keyword_paths = ["models/芭比_zh_raspberry-pi_v3_0_0/芭比_zh_raspberry-pi_v3_0_0.ppn"]`
[model] 马铃薯唤醒词 2024-05-23 20:38:27 +08:00			`model_path = "models/porcupine_params_zh.pv"`
update 2024-05-23 01:27:51 +08:00
			`hd_trigger = 'button'`

			`mircophone_device = 2`
			`speaker_device = 2`

			`else:`

[model] 马铃薯唤醒词 2024-05-23 20:38:27 +08:00			`keywords = ['hey google', 'ok google']`
update 2024-05-23 01:27:51 +08:00			`keyword_paths = None`
			`model_path = None`
[model] 马铃薯唤醒词 2024-05-23 20:38:27 +08:00
update 2024-05-23 01:27:51 +08:00
			`hd_trigger = 'keyboard'`
			`player = 'opencv'`


			`import argparse`
			`parser = argparse.ArgumentParser()`
			`# server params`


			`# recorder paramters`
			`parser.add_argument('--voice_trigger', type=bool, default=True, help='Voice trigger')`
			`parser.add_argument('--access_key',default=ACCESS_KEY,`
			`help='AccessKey obtained from Picovoice Console (https://console.picovoice.ai/)')`
			`parser.add_argument('--keywords',nargs='+',choices=sorted(pvporcupine.KEYWORDS),type=list,`
			`default=keywords,`
			`help='List of default keywords for detection. Available keywords: %s' % ', '.join(`
			`'%s' % w for w in sorted(pvporcupine.KEYWORDS)),metavar='')`
			`parser.add_argument('--keyword_paths',nargs='+',`
			`default=keyword_paths,`
			help="Absolute paths to keyword model files. If not set it will be populated from `--keywords` argument")
			`parser.add_argument('--library_path',default=None,`
			help='Absolute path to dynamic library. Default: using the library provided by `pvporcupine`')
			`parser.add_argument('--model_path',`
			`default=model_path,`
			`help='Absolute path to the file containing model parameters. '`
			'Default: using the library provided by `pvporcupine`')
			`parser.add_argument('--sensitivities',type=float,`
			`default=0.9,`
			`help="Sensitivities for detecting keywords. Each value should be a number within [0, 1]. A higher "`
			`"sensitivity results in fewer misses at the cost of increasing the false alarm rate. If not set 0.5 "`
			`"will be used.")`
			`parser.add_argument('--hd_trigger', type=str,`
			`# default='keyboard',`
			`default=hd_trigger,`
			`help='Hardware trigger')`
			`parser.add_argument('--keyboard_key', type=str, default='space', help='Keyboard key')`

			`# recorder paramters`
			`parser.add_argument('--IN_CHUNK', type=int, default=3840, help='Record chunk size') # 原来的`
			`parser.add_argument('--IN_RATE', type=int, default=16000, help='Audio rate')`
			`parser.add_argument('--IN_FORMAT', type=int, default=16, help='Audio format')`
			`parser.add_argument('--IN_CHANNELS', type=int, default=1, help='Audio channels')`
			`parser.add_argument('--IN_filename', type=str, default=None, help='Audio file name')`
			`parser.add_argument('--IN_frames_per_buffer', type=int, default=512, help='Frames per buffer')`
			`parser.add_argument('--min_stream_record_time', type=float, default=0.5, help='Min stream record time, sec')`
[bug] board 2024-05-23 17:36:02 +08:00			`parser.add_argument('--max_slience_time', type=int, default=10, help='Max slient time when recording, sec')`
[bug] board 2024-05-23 22:37:37 +08:00			`parser.add_argument('--min_act_time', type=float, default=0.6, help='Min inactive time, sec') # 等待多少秒沉默就发送音频`
update 2024-05-23 01:27:51 +08:00			`parser.add_argument('--mircophone_device', type=int, default=mircophone_device, help='Microphone device index')`

			`# player paramters`
			`parser.add_argument('--speaker_device', type=int, default=speaker_device, help='Speaker device index')`
			`parser.add_argument('--OUT_CHUNK', type=int, default=1024, help='Player chunk size')`
			`parser.add_argument('--OUT_RATE', type=int, default=22050, help='Player audio rate')`
			`parser.add_argument('--OUT_FORMAT', type=int, default=16, help='Player audio format')`
			`parser.add_argument('--OUT_CHANNELS', type=int, default=1, help='Player audio channels')`
			`parser.add_argument('--OUT_filename', type=str, default=None, help='Player audio file name')`
[bug] board 2024-05-23 17:35:05 +08:00			`parser.add_argument('--OUT_frames_per_buffer', type=int, default=11025, help='Player frames per buffer')`
update 2024-05-23 01:27:51 +08:00
			`# log paramters`
			`parser.add_argument('--log_file', type=str, default='ws_client.log', help='Log file')`
			`parser.add_argument('--log_level', type=str, default='INFO', help='Log level')`

			`parser.add_argument('--debug', type=bool, default=False, help='Debug mode')`
			`args = parser.parse_args()`

			`# sort out args and params`
			`server_args = {`
			`'server_url': server_url,`
			`'session_id': session_id,`
			`}`

			`recorder_args = {`
			`'board': board,`
			`'access_key': args.access_key,`
			`'keywords': args.keywords,`
			`'keyword_paths': args.keyword_paths,`
			`'library_path': args.library_path,`
			`'model_path': args.model_path,`
			`'sensitivities': args.sensitivities,`
			`'hd_trigger': args.hd_trigger,`
			`'keyboard_key': args.keyboard_key,`
			`'voice_trigger': args.voice_trigger,`
			`'CHUNK': args.IN_CHUNK,`
			`'FORMAT': pyaudio.paInt16 if args.IN_FORMAT == 16 else pyaudio.paInt32,`
			`'CHANNELS': args.IN_CHANNELS,`
			`'RATE': args.IN_RATE,`
新交互逻辑，长按/短按 2024-05-23 16:07:23 +08:00			`'min_act_time': args.min_act_time,`
update 2024-05-23 01:27:51 +08:00			`'max_slience_time': args.max_slience_time,`
			`'min_stream_record_time': args.min_stream_record_time,`
			`'input_device_index': args.mircophone_device,`
			`'frames_per_buffer': args.IN_frames_per_buffer,`
			`}`

			`player_args = {`
			`'output_device_index': args.speaker_device,`
			`'CHUNK': args.OUT_CHUNK,`
			`'FORMAT': pyaudio.paInt16 if args.OUT_FORMAT == 16 else pyaudio.paInt32,`
			`'CHANNELS': args.OUT_CHANNELS,`
			`'RATE': args.OUT_RATE,`
			`'filename': args.OUT_filename,`
			`'frames_per_buffer': args.OUT_frames_per_buffer,`
			`}`

			`log_args = {`
			`'log_file': args.log_file,`
			`'log_level': args.log_level,`
			`}`


			`localclient = WebSocketClinet(`
			`board=board,`
			`server_args=server_args,`
			`recorder_args=recorder_args,`
			`player_args=player_args,`
			`excute_args=excute_args,`
			`log_args=log_args)`
			`localclient.process_init()`