|
| 1 | +import argparse |
| 2 | +from ktransformers.server.backend.args import ConfigArgs, default_args |
| 3 | + |
| 4 | + |
| 5 | +class ArgumentParser: |
| 6 | + def __init__(self, cfg): |
| 7 | + self.cfg = cfg |
| 8 | + |
| 9 | + def parse_args(self): |
| 10 | + parser = argparse.ArgumentParser(prog="kvcache.ai", description="Ktransformers") |
| 11 | + parser.add_argument("--host", type=str, default=self.cfg.server_ip) |
| 12 | + parser.add_argument("--port", type=int, default=self.cfg.server_port) |
| 13 | + parser.add_argument("--ssl_keyfile", type=str) |
| 14 | + parser.add_argument("--ssl_certfile", type=str) |
| 15 | + parser.add_argument("--web", type=bool, default=self.cfg.mount_web) |
| 16 | + parser.add_argument("--model_name", type=str, default=self.cfg.model_name) |
| 17 | + parser.add_argument("--model_dir", type=str, default=self.cfg.model_dir) |
| 18 | + parser.add_argument( |
| 19 | + "--device", type=str, default=self.cfg.model_device, help="Warning: Abandoning this parameter" |
| 20 | + ) |
| 21 | + parser.add_argument("--gguf_path", type=str, default=self.cfg.gguf_path) |
| 22 | + parser.add_argument("--optimize_config_path", default=self.cfg.optimize_config_path, type=str, required=False) |
| 23 | + parser.add_argument("--cpu_infer", type=int, default=self.cfg.cpu_infer) |
| 24 | + parser.add_argument("--type", type=str, default=self.cfg.backend_type) |
| 25 | + |
| 26 | + # model configs |
| 27 | + # parser.add_argument("--model_cache_lens", type=int, default=self.cfg.cache_lens) # int? |
| 28 | + parser.add_argument("--paged", type=bool, default=self.cfg.paged) |
| 29 | + parser.add_argument("--total_context", type=int, default=self.cfg.total_context) |
| 30 | + parser.add_argument("--max_batch_size", type=int, default=self.cfg.max_batch_size) |
| 31 | + parser.add_argument("--max_chunk_size", type=int, default=self.cfg.max_chunk_size) |
| 32 | + parser.add_argument("--max_new_tokens", type=int, default=self.cfg.max_new_tokens) |
| 33 | + parser.add_argument("--json_mode", type=bool, default=self.cfg.json_mode) |
| 34 | + parser.add_argument("--healing", type=bool, default=self.cfg.healing) |
| 35 | + parser.add_argument("--ban_strings", type=list, default=self.cfg.ban_strings, required=False) |
| 36 | + parser.add_argument("--gpu_split", type=str, default=self.cfg.gpu_split, required=False) |
| 37 | + parser.add_argument("--length", type=int, default=self.cfg.length, required=False) |
| 38 | + parser.add_argument("--rope_scale", type=float, default=self.cfg.rope_scale, required=False) |
| 39 | + parser.add_argument("--rope_alpha", type=float, default=self.cfg.rope_alpha, required=False) |
| 40 | + parser.add_argument("--no_flash_attn", type=bool, default=self.cfg.no_flash_attn) |
| 41 | + parser.add_argument("--low_mem", type=bool, default=self.cfg.low_mem) |
| 42 | + parser.add_argument("--experts_per_token", type=int, default=self.cfg.experts_per_token, required=False) |
| 43 | + parser.add_argument("--load_q4", type=bool, default=self.cfg.load_q4) |
| 44 | + parser.add_argument("--fast_safetensors", type=bool, default=self.cfg.fast_safetensors) |
| 45 | + parser.add_argument("--draft_model_dir", type=str, default=self.cfg.draft_model_dir, required=False) |
| 46 | + parser.add_argument("--no_draft_scale", type=bool, default=self.cfg.no_draft_scale) |
| 47 | + parser.add_argument("--modes", type=bool, default=self.cfg.modes) |
| 48 | + parser.add_argument("--mode", type=str, default=self.cfg.mode) |
| 49 | + parser.add_argument("--username", type=str, default=self.cfg.username) |
| 50 | + parser.add_argument("--botname", type=str, default=self.cfg.botname) |
| 51 | + parser.add_argument("--system_prompt", type=str, default=self.cfg.system_prompt, required=False) |
| 52 | + parser.add_argument("--temperature", type=float, default=self.cfg.temperature) |
| 53 | + parser.add_argument("--smoothing_factor", type=float, default=self.cfg.smoothing_factor) |
| 54 | + parser.add_argument("--dynamic_temperature", type=str, default=self.cfg.dynamic_temperature, required=False) |
| 55 | + parser.add_argument("--top_k", type=int, default=self.cfg.top_k) |
| 56 | + parser.add_argument("--top_p", type=float, default=self.cfg.top_p) |
| 57 | + parser.add_argument("--top_a", type=float, default=self.cfg.top_a) |
| 58 | + parser.add_argument("--skew", type=float, default=self.cfg.skew) |
| 59 | + parser.add_argument("--typical", type=float, default=self.cfg.typical) |
| 60 | + parser.add_argument("--repetition_penalty", type=float, default=self.cfg.repetition_penalty) |
| 61 | + parser.add_argument("--frequency_penalty", type=float, default=self.cfg.frequency_penalty) |
| 62 | + parser.add_argument("--presence_penalty", type=float, default=self.cfg.presence_penalty) |
| 63 | + parser.add_argument("--max_response_tokens", type=int, default=self.cfg.max_response_tokens) |
| 64 | + parser.add_argument("--response_chunk", type=int, default=self.cfg.response_chunk) |
| 65 | + parser.add_argument("--no_code_formatting", type=bool, default=self.cfg.no_code_formatting) |
| 66 | + parser.add_argument("--cache_8bit", type=bool, default=self.cfg.cache_8bit) |
| 67 | + parser.add_argument("--cache_q4", type=bool, default=self.cfg.cache_q4) |
| 68 | + parser.add_argument("--ngram_decoding", type=bool, default=self.cfg.ngram_decoding) |
| 69 | + parser.add_argument("--print_timings", type=bool, default=self.cfg.print_timings) |
| 70 | + parser.add_argument("--amnesia", type=bool, default=self.cfg.amnesia) |
| 71 | + parser.add_argument("--batch_size", type=int, default=self.cfg.batch_size) |
| 72 | + parser.add_argument("--cache_lens", type=int, default=self.cfg.cache_lens) |
| 73 | + |
| 74 | + # log configs |
| 75 | + # log level: debug, info, warn, error, crit |
| 76 | + parser.add_argument("--log_dir", type=str, default=self.cfg.log_dir) |
| 77 | + parser.add_argument("--log_file", type=str, default=self.cfg.log_file) |
| 78 | + parser.add_argument("--log_level", type=str, default=self.cfg.log_level) |
| 79 | + parser.add_argument("--backup_count", type=int, default=self.cfg.backup_count) |
| 80 | + |
| 81 | + # db configs |
| 82 | + parser.add_argument("--db_type", type=str, default=self.cfg.db_type) |
| 83 | + parser.add_argument("--db_host", type=str, default=self.cfg.db_host) |
| 84 | + parser.add_argument("--db_port", type=str, default=self.cfg.db_port) |
| 85 | + parser.add_argument("--db_name", type=str, default=self.cfg.db_name) |
| 86 | + parser.add_argument("--db_pool_size", type=int, default=self.cfg.db_pool_size) |
| 87 | + parser.add_argument("--db_database", type=str, default=self.cfg.db_database) |
| 88 | + |
| 89 | + # user config |
| 90 | + parser.add_argument("--user_secret_key", type=str, default=self.cfg.user_secret_key) |
| 91 | + parser.add_argument("--user_algorithm", type=str, default=self.cfg.user_algorithm) |
| 92 | + |
| 93 | + # web config |
| 94 | + parser.add_argument("--web_cross_domain", type=bool, default=self.cfg.web_cross_domain) |
| 95 | + |
| 96 | + # file config |
| 97 | + parser.add_argument("--file_upload_dir", type=str, default=self.cfg.file_upload_dir) |
| 98 | + parser.add_argument("--assistant_store_dir", type=str, default=self.cfg.assistant_store_dir) |
| 99 | + # local chat |
| 100 | + parser.add_argument("--prompt_file", type=str, default=self.cfg.prompt_file) |
| 101 | + |
| 102 | + args = parser.parse_args() |
| 103 | + # set config from args |
| 104 | + for key, value in vars(args).items(): |
| 105 | + if value is not None and hasattr(self.cfg, key): |
| 106 | + setattr(self.cfg, key, value) |
| 107 | + # we add the name not match args individually |
| 108 | + self.cfg.model_device = args.device |
| 109 | + self.cfg.mount_web = args.web |
| 110 | + self.cfg.server_ip = args.host |
| 111 | + self.cfg.server_port = args.port |
| 112 | + self.cfg.backend_type = args.type |
| 113 | + return args |
0 commit comments