codedog-ai
diff --git a/‎README.md
+2 b/‎README.md
+2
diff --git a/‎codedog/chains/code_review/base.py
+2-1 b/‎codedog/chains/code_review/base.py
+2-1
diff --git a/‎codedog/chains/code_review/prompts.py
+3-2 b/‎codedog/chains/code_review/prompts.py
+3-2
diff --git a/‎codedog/chains/code_review/translate_code_review_chain.py
+2-1 b/‎codedog/chains/code_review/translate_code_review_chain.py
+2-1
diff --git a/‎codedog/chains/pr_summary/base.py
+57-23 b/‎codedog/chains/pr_summary/base.py
+57-23
diff --git a/‎codedog/chains/pr_summary/prompts.py
+4-2 b/‎codedog/chains/pr_summary/prompts.py
+4-2
diff --git a/‎codedog/chains/pr_summary/translate_pr_summary_chain.py
+3-2 b/‎codedog/chains/pr_summary/translate_pr_summary_chain.py
+3-2
diff --git a/‎codedog/chains/prompts.py
+3-2 b/‎codedog/chains/prompts.py
+3-2
diff --git a/‎codedog/models/change_file.py
+1-1 b/‎codedog/models/change_file.py
+1-1
diff --git a/‎codedog/models/commit.py
+3-13 b/‎codedog/models/commit.py
+3-13
diff --git a/‎codedog/models/diff.py
+3-1 b/‎codedog/models/diff.py
+3-1
diff --git a/‎codedog/models/issue.py
+2-13 b/‎codedog/models/issue.py
+2-13
diff --git a/‎codedog/models/pull_request.py
+2-13 b/‎codedog/models/pull_request.py
+2-13
diff --git a/‎codedog/models/repository.py
+2-13 b/‎codedog/models/repository.py
+2-13
@@ -118,3 +118,5 @@ settings:
 | AZURE_OPENAI_API_BASE          | No       |                   | Azure openai api base                   |
 | AZURE_OPENAI_DEPLOYMENT_ID     | No       |                   | Azure openai deployment id for gpt 3.5  |
 | AZURE_OPENAI_GPT4_DEPLOYMENT_ID| No       |                   | Azure openai deployment id for gpt 4    |
+
+# How to release
@@ -3,13 +3,14 @@
 from itertools import zip_longest
 from typing import Any, Dict, List, Optional
 
-from langchain import BasePromptTemplate, LLMChain
 from langchain.base_language import BaseLanguageModel
 from langchain.callbacks.manager import (
     AsyncCallbackManagerForChainRun,
     CallbackManagerForChainRun,
 )
+from langchain.chains import LLMChain
 from langchain.chains.base import Chain
+from langchain_core.prompts import BasePromptTemplate
 from pydantic import Field
 
 from codedog.chains.code_review.prompts import CODE_REVIEW_PROMPT
 
@@ -1,8 +1,9 @@
 # TODO: Localization
-from langchain import PromptTemplate
+from langchain_core.prompts import PromptTemplate
 
 from codedog.templates import grimoire_en
 
 CODE_REVIEW_PROMPT = PromptTemplate(
-    template=grimoire_en.CODE_SUGGESTION, input_variables=["name", "language", "content"]
+    template=grimoire_en.CODE_SUGGESTION,
+    input_variables=["name", "language", "content"],
 )
@@ -3,8 +3,9 @@
 from itertools import zip_longest
 from typing import List
 
-from langchain import BasePromptTemplate, LLMChain
 from langchain.base_language import BaseLanguageModel
+from langchain.chains import LLMChain
+from langchain_core.prompts import BasePromptTemplate
 from pydantic import Field
 
 from codedog.chains.code_review.base import CodeReviewChain
 
@@ -2,15 +2,16 @@
 
 from typing import Any, Dict, List, Optional
 
-from langchain import BasePromptTemplate, LLMChain
 from langchain.base_language import BaseLanguageModel
 from langchain.callbacks.manager import (
     AsyncCallbackManagerForChainRun,
     CallbackManagerForChainRun,
 )
+from langchain.chains import LLMChain
 from langchain.chains.base import Chain
 from langchain.output_parsers import OutputFixingParser, PydanticOutputParser
 from langchain.schema import BaseOutputParser
+from langchain_core.prompts import BasePromptTemplate
 from pydantic import Extra, Field
 
 from codedog.chains.pr_summary.prompts import CODE_SUMMARY_PROMPT, PR_SUMMARY_PROMPT
@@ -20,6 +21,8 @@
     PullRequestProcessor,
 )
 
+processor = PullRequestProcessor.build()
+
 
 class PRSummaryChain(Chain):
     """Summarize a pull request.
@@ -32,17 +35,13 @@ class PRSummaryChain(Chain):
     - code_summaries(Dict[str, str]): changed code file summarizations, key is file path.
     """
 
-    # TODO: input keys validation
-
     code_summary_chain: LLMChain = Field(exclude=True)
     """Chain to use to summarize code change."""
     pr_summary_chain: LLMChain = Field(exclude=True)
     """Chain to use to summarize PR."""
 
     parser: BaseOutputParser = Field(exclude=True)
     """Parse pr summarized result to PRSummary object."""
-    processor: PullRequestProcessor = Field(exclude=True, default_factory=PullRequestProcessor.build)
-    """PR data process."""
 
     _input_keys: List[str] = ["pull_request"]
     _output_keys: List[str] = ["pr_summary", "code_summaries"]
@@ -78,15 +77,21 @@ def review(self, inputs, _run_manager) -> Dict[str, Any]:
 
         code_summary_inputs = self._process_code_summary_inputs(pr)
         code_summary_outputs = (
-            self.code_summary_chain.apply(code_summary_inputs, callbacks=_run_manager.get_child(tag="CodeSummary"))
+            self.code_summary_chain.apply(
+                code_summary_inputs, callbacks=_run_manager.get_child(tag="CodeSummary")
+            )
             if code_summary_inputs
             else []
         )
 
-        code_summaries = self.processor.build_change_summaries(code_summary_inputs, code_summary_outputs)
+        code_summaries = processor.build_change_summaries(
+            code_summary_inputs, code_summary_outputs
+        )
 
         pr_summary_input = self._process_pr_summary_input(pr, code_summaries)
-        pr_summary_output = self.pr_summary_chain(pr_summary_input, callbacks=_run_manager.get_child(tag="PRSummary"))
+        pr_summary_output = self.pr_summary_chain(
+            pr_summary_input, callbacks=_run_manager.get_child(tag="PRSummary")
+        )
 
         return self._process_result(pr_summary_output, code_summaries)
 
@@ -95,26 +100,38 @@ async def areview(self, inputs, _run_manager) -> Dict[str, Any]:
 
         code_summary_inputs = self._process_code_summary_inputs(pr)
         code_summary_outputs = (
-            await self.code_summary_chain.aapply(code_summary_inputs, callbacks=_run_manager.get_child())
+            await self.code_summary_chain.aapply(
+                code_summary_inputs, callbacks=_run_manager.get_child()
+            )
             if code_summary_inputs
             else []
         )
 
-        code_summaries = self.processor.build_change_summaries(code_summary_inputs, code_summary_outputs)
+        code_summaries = processor.build_change_summaries(
+            code_summary_inputs, code_summary_outputs
+        )
 
         pr_summary_input = self._process_pr_summary_input(pr, code_summaries)
-        pr_summary_output = await self.pr_summary_chain.acall(pr_summary_input, callbacks=_run_manager.get_child())
+        pr_summary_output = await self.pr_summary_chain.ainvoke(
+            pr_summary_input, callbacks=_run_manager.get_child()
+        )
 
         return await self._aprocess_result(pr_summary_output, code_summaries)
 
-    def _call(self, inputs: Dict[str, Any], run_manager: Optional[CallbackManagerForChainRun] = None) -> Dict[str, Any]:
+    def _call(
+        self,
+        inputs: Dict[str, Any],
+        run_manager: Optional[CallbackManagerForChainRun] = None,
+    ) -> Dict[str, Any]:
         _run_manager = run_manager or CallbackManagerForChainRun.get_noop_manager()
         _run_manager.on_text(inputs["pull_request"].json() + "\n")
 
         return self.review(inputs, _run_manager)
 
     async def _acall(
-        self, inputs: Dict[str, Any], run_manager: Optional[AsyncCallbackManagerForChainRun] = None
+        self,
+        inputs: Dict[str, Any],
+        run_manager: Optional[AsyncCallbackManagerForChainRun] = None,
     ) -> Dict[str, Any]:
         _run_manager = run_manager or CallbackManagerForChainRun.get_noop_manager()
         await _run_manager.on_text(inputs["pull_request"].json() + "\n")
@@ -123,28 +140,36 @@ async def _acall(
 
     def _process_code_summary_inputs(self, pr: PullRequest) -> List[Dict[str, str]]:
         input_data = []
-        code_files = self.processor.get_diff_code_files(pr)
+        code_files = processor.get_diff_code_files(pr)
         for code_file in code_files:
             input_item = {
-                "content": code_file.diff_content.content[:2000],  # TODO: handle long diff
+                "content": code_file.diff_content.content[
+                    :2000
+                ],  # TODO: handle long diff
                 "name": code_file.full_name,
                 "language": SUFFIX_LANGUAGE_MAPPING.get(code_file.suffix, ""),
             }
             input_data.append(input_item)
 
         return input_data
 
-    def _process_pr_summary_input(self, pr: PullRequest, code_summaries: List[ChangeSummary]) -> Dict[str, str]:
-        change_files_material: str = self.processor.gen_material_change_files(pr.change_files)
-        code_summaries_material = self.processor.gen_material_code_summaries(code_summaries)
-        pr_metadata_material = self.processor.gen_material_pr_metadata(pr)
+    def _process_pr_summary_input(
+        self, pr: PullRequest, code_summaries: List[ChangeSummary]
+    ) -> Dict[str, str]:
+        change_files_material: str = processor.gen_material_change_files(
+            pr.change_files
+        )
+        code_summaries_material = processor.gen_material_code_summaries(code_summaries)
+        pr_metadata_material = processor.gen_material_pr_metadata(pr)
         return {
             "change_files": change_files_material,
             "code_summaries": code_summaries_material,
             "metadata": pr_metadata_material,
         }
 
-    def _process_result(self, pr_summary_output: Dict[str, Any], code_summaries: List[ChangeSummary]) -> Dict[str, Any]:
+    def _process_result(
+        self, pr_summary_output: Dict[str, Any], code_summaries: List[ChangeSummary]
+    ) -> Dict[str, Any]:
         return {
             "pr_summary": pr_summary_output["text"],
             "code_summaries": code_summaries,
@@ -167,7 +192,16 @@ def from_llm(
         pr_summary_prompt: BasePromptTemplate = PR_SUMMARY_PROMPT,
         **kwargs,
     ) -> PRSummaryChain:
-        parser = OutputFixingParser.from_llm(llm=pr_summary_llm, parser=PydanticOutputParser(pydantic_object=PRSummary))
+        parser = OutputFixingParser.from_llm(
+            llm=pr_summary_llm, parser=PydanticOutputParser(pydantic_object=PRSummary)
+        )
         code_summary_chain = LLMChain(llm=code_summary_llm, prompt=code_summary_prompt)
-        pr_summary_chain = LLMChain(llm=pr_summary_llm, prompt=pr_summary_prompt, output_parser=parser)
-        return cls(code_summary_chain=code_summary_chain, pr_summary_chain=pr_summary_chain, parser=parser, **kwargs)
+        pr_summary_chain = LLMChain(
+            llm=pr_summary_llm, prompt=pr_summary_prompt, output_parser=parser
+        )
+        return cls(
+            code_summary_chain=code_summary_chain,
+            pr_summary_chain=pr_summary_chain,
+            parser=parser,
+            **kwargs,
+        )
@@ -1,5 +1,5 @@
-from langchain import PromptTemplate
 from langchain.output_parsers import PydanticOutputParser
+from langchain_core.prompts import PromptTemplate
 
 from codedog.models import PRSummary
 from codedog.templates import grimoire_en
@@ -11,4 +11,6 @@
     input_variables=["metadata", "change_files", "code_summaries"],
     partial_variables={"format_instructions": parser.get_format_instructions()},
 )
-CODE_SUMMARY_PROMPT = PromptTemplate(template=grimoire_en.CODE_SUMMARY, input_variables=["name", "language", "content"])
+CODE_SUMMARY_PROMPT = PromptTemplate(
+    template=grimoire_en.CODE_SUMMARY, input_variables=["name", "language", "content"]
+)
@@ -3,9 +3,10 @@
 from itertools import zip_longest
 from typing import Any, Dict, List
 
-from langchain import BasePromptTemplate, LLMChain
 from langchain.base_language import BaseLanguageModel
+from langchain.chains import LLMChain
 from langchain.output_parsers import OutputFixingParser, PydanticOutputParser
+from langchain_core.prompts import BasePromptTemplate
 from pydantic import Field
 
 from codedog.chains.pr_summary.base import PRSummaryChain
@@ -116,7 +117,7 @@ def _translate_code_summaries(
         return code_summaries
 
     async def _atranslate_summary(self, summary: PRSummary) -> PRSummary:
-        response = await self.translate_chain.acall(
+        response = await self.translate_chain.ainvoke(
             {
                 "language": self.language,
                 "description": "Changed file brief summary (must in single line!).",
 
@@ -1,7 +1,8 @@
-from langchain import PromptTemplate
+from langchain_core.prompts import PromptTemplate
 
 from codedog.templates import grimoire_en
 
 TRANSLATE_PROMPT = PromptTemplate(
-    template=grimoire_en.TRANSLATE_PR_REVIEW, input_variables=["language", "description", "content"]
+    template=grimoire_en.TRANSLATE_PR_REVIEW,
+    input_variables=["language", "description", "content"],
 )
@@ -62,5 +62,5 @@ class ChangeFile(BaseModel):
     diff_content: DiffContent = Field(default="", exclude=True)
     """The diff content of this file."""
 
-    _raw: Optional[object] = Field(default=None, exclude=True)
+    raw: Optional[object] = Field(default=None, exclude=True)
     """Raw object generated by client api of this change file."""
@@ -1,7 +1,6 @@
 from typing import Any
 
-from pydantic import BaseModel, Field, validator
-from pydantic.fields import ModelField
+from pydantic import BaseModel, Field
 
 
 class Commit(BaseModel):
@@ -15,15 +14,6 @@ class Commit(BaseModel):
     message: str = Field(default="")
     """Commit message."""
 
-    _raw: object = Field(default=None, exclude=True)
+    raw: object = Field(default=None, exclude=True)
+    """git commit raw object"""
     """git commit raw object"""
-
-    @validator("*", pre=True, allow_reuse=True)
-    def none_to_default(value: Any, field: ModelField):
-        if value is not None:
-            return value
-        if field.default:
-            return field.default
-        if field.default_factory:
-            return (field.default_factory)()
-        raise ValueError(f"Field {field.name} is None.")
@@ -1,6 +1,6 @@
 from typing import Optional
 
-from pydantic import BaseModel, Field
+from pydantic import BaseModel, ConfigDict, Field
 from unidiff import PatchedFile
 
 
@@ -22,6 +22,8 @@ class DiffSegment(BaseModel):
 
 
 class DiffContent(BaseModel):
+    model_config = ConfigDict(arbitrary_types_allowed=True)
+
     add_count: int = Field()
     """Added lines count."""
     remove_count: int = Field()
 
@@ -1,7 +1,6 @@
 from typing import Any
 
-from pydantic import BaseModel, Field, validator
-from pydantic.fields import ModelField
+from pydantic import BaseModel, Field
 
 
 class Issue(BaseModel):
@@ -15,15 +14,5 @@ class Issue(BaseModel):
     url: str = Field(default="")
     """Issue url."""
 
-    _raw: object = Field(default=None, exclude=True)
+    raw: object = Field(default=None, exclude=True)
     """git issue raw object"""
-
-    @validator("*", pre=True, allow_reuse=True)
-    def none_to_default(value: Any, field: ModelField):
-        if value is not None or field.type_ not in [str, int]:
-            return value
-        if field.default:
-            return field.default
-        if field.default_factory:
-            return (field.default_factory)()
-        raise ValueError(f"Field {field.name} is None.")
@@ -1,7 +1,6 @@
 from typing import Any
 
-from pydantic import BaseModel, Field, validator
-from pydantic.fields import ModelField
+from pydantic import BaseModel, Field
 
 from codedog.models.change_file import ChangeFile
 from codedog.models.issue import Issue
@@ -32,15 +31,5 @@ class PullRequest(BaseModel):
     """git PR target repository"""
     source_repository: Repository = Field(default=None, exclude=True)
     """git PR source repository"""
-    _raw: object = Field(default=None, exclude=True)
+    raw: object = Field(default=None, exclude=True)
     """git PR raw object"""
-
-    @validator("*", pre=True, allow_reuse=True)
-    def none_to_default(value: Any, field: ModelField):
-        if value is not None or field.type_ not in [str, int, float, bool, list, dict]:
-            return value
-        if field.default:
-            return field.default
-        if field.default_factory:
-            return (field.default_factory)()
-        raise ValueError(f"Field {field.name} is None.")
@@ -1,7 +1,6 @@
 from typing import Any
 
-from pydantic import BaseModel, Field, validator
-from pydantic.fields import ModelField
+from pydantic import BaseModel, Field
 
 
 class Repository(BaseModel):
@@ -15,15 +14,5 @@ class Repository(BaseModel):
     repository_url: str = Field(default="")
     """Repository url this pull request belongs to."""
 
-    _raw: object = Field(default=None, exclude=True)
+    raw: object = Field(default=None, exclude=True)
     """git repository raw object"""
-
-    @validator("*", pre=True, allow_reuse=True)
-    def none_to_default(value: Any, field: ModelField):
-        if value is not None or field.type_ not in [str, int, float, bool, list, dict]:
-            return value
-        if field.default:
-            return field.default
-        if field.default_factory:
-            return (field.default_factory)()
-        raise ValueError(f"Field {field.name} is None.")
Original file line number	Diff line number	Diff line change
`@@ -1,7 +1,8 @@`
`1`		`-from langchain import PromptTemplate`
	`1`	`+from langchain_core.prompts import PromptTemplate`
`2`	`2`
`3`	`3`	`from codedog.templates import grimoire_en`
`4`	`4`
`5`	`5`	`TRANSLATE_PROMPT = PromptTemplate(`
`6`		`- template=grimoire_en.TRANSLATE_PR_REVIEW, input_variables=["language", "description", "content"]`
	`6`	`+ template=grimoire_en.TRANSLATE_PR_REVIEW,`
	`7`	`+ input_variables=["language", "description", "content"],`
`7`	`8`	`)`